Informatie

4.6: Genetische code - biologie


Hoe ga je van vier letters naar 20 aminozuren?

Je hebt een code nodig. En de code die de informatie die in DNA en RNA is ingebed verandert in geordende aminozuren en eiwitten, is de genetische code. En elk levend organisme gebruikt dezelfde genetische code.

De genetische code

Hoe wordt de informatie in een gen gecodeerd? Het antwoord is de genetische code. De genetisch code bestaat uit de reeks stikstofbasen - A, C, G, U - in een mRNA-keten. De vier basen vormen de "letters" van de genetische code. De letters worden gecombineerd in groepen van drie om code "woorden" te vormen, genaamd codons. Elk codon staat voor (codeert) één aminozuur, tenzij het codeert voor een start- of stopsignaal.

Er zijn 20 veel voorkomende aminozuren in eiwitten. Er zijn 64 mogelijke codons, meer dan genoeg om te coderen voor de 20 aminozuren. De genetische code wordt getoond in Figuur onderstaand. Ga naar deze link om te zien hoe wetenschappers de genetische code hebben gekraakt: http://www.dnalc.org/view/16494-Animation-22-DNA-words-are-three-letters-long-.html.

De genetische code. Om het aminozuur voor een bepaald codon te vinden, zoekt u de cel in de tabel voor de eerste en tweede basen van het codon. Zoek dan in die cel het codon met het juiste derde honk. Bijvoorbeeld CUG-codes voor leucine, AAG-codes voor lysine en GGG-codes voor glycine.

De genetische code lezen

Zoals getoond in Figuur hierboven codeert het codon AUG voor het aminozuur methionine. Dit codon is ook de start codon dat begint met vertalen. Het startcodon bepaalt het leeskader van mRNA. De leeskader is de manier waarop de letters in codons worden verdeeld. Na het AUG-startcodon worden de volgende drie letters gelezen als het tweede codon. De volgende drie letters daarna worden gelezen als het derde codon, enzovoort. Dit wordt geïllustreerd in Figuur onderstaand. Het mRNA-molecuul wordt codon voor codon afgelezen totdat a stop codon is bereikt. UAG, UGA en UAA zijn allemaal stopcodons. Ze coderen niet voor aminozuren. Stopcodons worden ook wel terminatiecodons genoemd.

Het lezen van de genetische code. De genetische code wordt drie basen tegelijk gelezen. Codons zijn de codewoorden van de genetische code. Voor welk aminozuur staat codon 2 in de tekening?

Kenmerken van de genetische code

De genetische code heeft een aantal belangrijke kenmerken.

  • De genetische code is universeel. Alle bekende levende organismen gebruiken dezelfde genetische code. Dit toont aan dat alle organismen een gemeenschappelijke evolutionaire geschiedenis delen.
  • De genetische code is ondubbelzinnig. Elk codon codeert voor slechts één aminozuur (of start of stop). Wat kan er gebeuren als codons coderen voor meer dan één aminozuur?
  • De genetische code is overbodig. De meeste aminozuren worden gecodeerd door meer dan één codon. In Figuur hierboven, hoeveel codons coderen voor het aminozuur threonine? Wat zou een voordeel kunnen zijn van het hebben van meer dan één codon voor hetzelfde aminozuur?

Samenvatting

  • De genetische code bestaat uit de volgorde van basen in DNA of RNA.
  • Groepen van drie basen vormen codons en elk codon staat voor één aminozuur (of start of stop).
  • De codons worden achtereenvolgens na het startcodon afgelezen totdat een stopcodon is bereikt.
  • De genetische code is universeel, ondubbelzinnig en overbodig.

Meer ontdekken

Ontdek meer I

Gebruik deze bron om de volgende vragen te beantwoorden.

  • Genetische code op http://www.nature.com/scitable/definition/genetic-code-13.
  1. Wat is de genetische code?
  2. Uit hoeveel nucleotiden bestaat een codon?
  3. Wat was het eerste codon dat in de genetische code werd ontcijferd? Voor welk aminozuur codeert dit codon?
  4. Hoeveel mogelijke codoncombinaties zijn er in de genetische code?
  5. Hoeveel stopsignalen zijn er in de genetische code?
  6. De genetische code is gedegenereerd. Leg deze verklaring uit.

Beoordeling

  1. Wat is de genetische code?
  2. Wat zijn codons? Hoeveel codons zijn er?
  3. Gebruik de genetische code om het volgende RNA-segment te vertalen in een sequentie van vijf aminozuren: GUC-GCG-CAU-AGC-AAG
  4. De genetische code is universeel, ondubbelzinnig en overbodig. Leg uit wat dit betekent.

Richard Dawkins: Universele DNA-code is 'knockdown' bewijs van evolutie

19 oktober 2009 – Evolutionair bioloog Richard Dawkins was vrijdag op Grounds om zijn nieuwe boek te bespreken, "De grootste show op aarde: het bewijs voor evolutie", die meer dan een dozijn argumentatielijnen en bewijzen uiteenzet ter ondersteuning van evolutie. Dawkins gaf een korte inleiding op elk van die bewijslijnen (elk krijgt een hoofdstuk in het boek), sprekend tot een publiek in een staande kamer in het Gilmer Hall Auditorium (Nog meer scores werden afgewezen nadat de zaal vol was).

Het meest overtuigende bewijs van allemaal, legde Dawkins uit, komt uit de moleculaire biologie - het feit dat DNA-code universeel is onder alle levende wezens, waarbij alle wezens identieke codesegmenten delen.

Dawkins, die onlangs met pensioen is gegaan als Charles Simonyi Professor of the Public Understanding of Science aan de Universiteit van Oxford, is misschien wel het meest bekend (en zeker het meest controversieel) vanwege zijn internationale bestseller 'The God Delusion' uit 2006. Daarin pleit hij voor de onwaarschijnlijkheid van het bestaan ​​van een opperwezen, en, meer provocerend, dat religie niet alleen verkeerd is, maar ook slecht, een positie die de zogenaamde "nieuwe atheïsten."

Maar op vrijdag sloeg Dawkins elke aanval op religie over en bleef hij bij het onderwerp in zijn laatste boek. Hij uitte echter voelbare minachting voor degenen die geloven in de jonge-aarde creationistische opvatting dat de aarde minder dan 10.000 jaar oud is, een opvatting waar 40 procent van de Amerikanen (en 28 procent van de Britten) het mee eens is, volgens een Gallup-enquête van Dawkins. aangehaald.

Aangezien de aarde in werkelijkheid 4,6 miljard jaar oud is, zei Dawkins, is de omvang van de fout in de jonge-aarde creationistische kijk gelijk aan het denken dat Noord-Amerika 8 meter breed is. Een dergelijke omvang van valse overtuiging zou op praktisch elk ander gebied onbruikbaar zijn, grapte Dawkins, en merkte op dat een loodgieter niet in staat zou zijn om zijn leidingen aan te sluiten en zijn werk te doen als zijn metingen zo'n fout zouden zijn.

Dawkins' nieuwe boek is een poging om het bewijs voor evolutie beter te verzamelen, in de hoop de 'verontrustende' mening te veranderen van sommigen die de creationistische visie onderschrijven. Hoewel Dawkins erkende dat het weinig zin had om in discussie te gaan met de meest door de wol geverfde creationisten (in antwoord op een student die vroeg hoe hij het beste mee kon doen aan de strijd tegen de creationistische visie), suggereerde hij dat de meest overtuigende tactiek om de wreedheid te laten vallen en de fascinerende manieren te delen waarop evolutie de natuurlijke wereld kan verklaren.

Dawkins zelf deed dat met een mengeling van wrange humor en een brede waardering voor de kracht van het idee van evolutie.

Het meest overtuigende bewijs voor evolutie komt van het beschouwen van de overeenkomsten tussen zoveel levende wezens, legde Dawkins uit.

Charles Darwin zelf was zich terdege bewust van de opvallende overeenkomsten in de skeletten van verschillende zoogdieren, zoals de vleugels van een vleermuis en de vingers van een mensenhand, legde Dawkins uit. De vleugel van de vleermuis bestaat uit vijf sets botten die het vlees ondersteunen dat ertussen is gedrapeerd. Vergeleken met de botstructuur van een menselijke hand, zijn de vijf vleugelbotten van de vleermuis behoorlijk langwerpig in verhouding tot zijn lichaam, maar er is een opvallende overeenkomst in het aantal en de rangschikking van de botten die duidelijk maakt, zei Dawkins, dat ze twee versies van hetzelfde. Dezelfde 'vijfvinger'-omtrek is zelfs zichtbaar in het skelet van een gevleugelde dinosaurus, de pterodactylus, die meer dan 65 miljoen jaar geleden leefde.

Hoewel Darwin beperkt was tot het observeren van een dergelijke kwalitatieve gelijkheid tussen soorten, is een soortgelijke les veel discreter duidelijk in vergelijkingen van de genetische code van verschillende wezens.

Om te beginnen is het opvallend dat al het leven, van planten en dieren tot bacteriën, virussen en schimmels, op hetzelfde DNA-coderingsmechanisme vertrouwt om de biologische instructies te dragen die bepalen hoe het wezen in elkaar zit, merkte Dawkins op. Wat van dier tot dier verschilt, is niet de structuur of het mechanisme van de code, maar de individuele genen.

Dankzij het Human Genome Project en soortgelijke projecten die de gensequenties van andere dieren hebben blootgelegd, zoals de chimpansee, kunnen wetenschappers de code nu tussen verschillende soorten vergelijken. Ze kunnen tekstueel worden vergeleken, zoals een bijbelgeleerde twee rollen zou kunnen vergelijken die het boek Genesis bevatten. Wanneer elke letter van twee gensequenties wordt vergeleken, vinden wetenschappers hele 'zinnen' en 'paragrafen' van identieke DNA-'tekst'.

In de toekomst, aangezien de steeds toenemende rekenkracht een toename van genoomsequencing mogelijk zal maken, zullen wetenschappers in staat zijn om gedetailleerde DNA-vergelijkingen te maken over de evolutionaire verwantschap van elke soort met elkaar. Er is al genoeg van dergelijk DNA-vergelijkingsbewijs om zonder twijfel te bewijzen dat alle levende wezens een gedeelde voorouders hebben, zei Dawkins. Dit tekstuele bewijs van de gemeenschappelijke afstamming van alle levende wezens is "knockdown-bewijs" van evolutie.


Wat zijn mestcellen en hoe werken ze?

Mestcellen, een soort granulocyten, bevatten chemicaliën die nodig zijn voor de immuunrespons van het lichaam. Deze cellen van het immuunsysteem zijn belangrijk voor wondgenezing, de aanmaak van nieuwe bloedcellen, immuuntolerantie en de eerstelijnsverdediging van uw lichaam tegen ziekteverwekkers.

Zoals een onderzoek het samenvatte, zijn mestcellen de 'allemaalvak' immuuncellen.

Mestcellen maken deel uit van ons aangeboren immuunsysteem en zijn essentieel voor de reactie van ons lichaam op indringers. Allemaal goed, totdat de zaken in de war raken.

Wanneer mestcellen te gemakkelijk triggeren, degranuleren ze, waardoor een lading histamine, heparine, prostaglandinen, tryptase en cytokinen te vaak in het lichaam terechtkomen. Dit veroorzaakt een verscheidenheid aan complicaties met schijnbaar onsamenhangende symptomen.

De klassieke functie van mestcellen in het immuunsysteem:

In dit gedeelte wordt uitgelegd hoe mestcellen normaal functioneren binnen het immuunsysteem (ga door als u dit allemaal al weet…)

Mestcellen zijn residente immuuncellen, wat betekent dat ze zich meestal niet in de bloedbaan bevinden, maar in weefsel, zoals bindweefsel. Mestcellen verschijnen bijvoorbeeld in de gebieden naast epitheelcellen (huidcellen, de bekleding van de darmen, oppervlaktecellen in de longen) of in de buurt van endotheelcellen, die bloedvaten vormen.

Granulocyten, een andere naam voor een mestcel, bevatten korrels met verschillende soorten moleculen erin. Net als kleine waterballonnen, kunnen mestcellen snel degranuleren - waarbij verschillende ontstekingsmoleculen vrijkomen in het omringende weefsel.

Hieronder ziet u een afbeelding (Creative Commons License [ref]) die de locaties van mestcellen langs de wand van een bloedvat laat zien. De tweede afbeelding toont de secretoire korrels in een mestcel die niet is geactiveerd.

IgE-antilichamen en immuunreacties:

Dit zal een snel overzicht zijn, met de hoogtepunten van hoe mestcellen reageren op ziekteverwekkers:[ref]

Receptoren bekend als FcɛRI-receptoren bevinden zich op het oppervlak van mestcellen. Ze binden aan IgE-antilichamen gemaakt door Th2-cellen en triggeren B-cellen om te differentiëren en IgE te creëren. Meestal gebeurt dit door een ziekteverwekker of parasieten.

Zodra IgE is aangemaakt, bindt het aan de FcɛRI-receptor op mestcellen. Dit primeert de mestcel voor activering zodra de andere helft van het IgE bindt aan een antigeen (op een pathogeen/parasiet/allergeen). Genaamd verknoping, de FcɛRI bindt aan IgE dat vervolgens aan een antigeen bindt.

Wanneer een mestcel wordt geactiveerd via de traditionele middelen van een antigeen-binding aan het IgE, een onmiddellijke reactie en een vertraagde reactie optreden.

Eerst: De onmiddellijke reactie gebeurt snel, binnen enkele minuten, waardoor de mestcel degranuleert en zijn met chemicaliën gevulde korrels in de omgeving vrijgeeft.

Eén korrel in mestcellen is histamine, die giftig is voor veel parasitaire organismen. Histamine staat echter meer bekend om de directe oorzaak van ontstekingen en allergiesymptomen. In een notendop, wanneer histamine zich bindt aan histaminereceptoren op een cel, veroorzaakt het een inflammatoire immuunrespons. Wanneer histamine zich bijvoorbeeld bindt aan een receptor op endotheelcellen (bloedvatcellen), veroorzaakt het vasculaire permeabiliteit, wat resulteert in zwelling en ontsteking. Wanneer histamine zich bindt aan histaminereceptoren op gladde spiercellen, kan dit ervoor zorgen dat de cellen samentrekken. In het maagdarmkanaal veroorzaakt dit braken en diarree om de ziekteverwekker kwijt te raken. Door de spieren rond de longen samen te trekken, veroorzaakt histamine hoesten, niezen en piepende ademhaling om de ziekteverwekker kwijt te raken.

Een ander bestanddeel van mestcelkorrels is: proteasen, die eiwitten afbreken. De mestcellen bevinden zich voornamelijk in bindweefsel, dat veel extracellulaire matrices heeft die zijn gemaakt van eiwitten die het weefsel bij elkaar houden. Door die extracellulaire matrix af ​​te breken met behulp van proteasen, kan vloeistof binnenkomen en het lichaam wegspoelen.

TNF-alfa komt ook voor in mestcellen. Het is een inflammatoire cytokine die bindt aan receptoren op het oppervlak van endotheelcellen (bloedvaten), waardoor endotheelcellen adhesiemoleculen inschakelen en meer immuuncellen rekruteren'8230

Tweede: Er is ook een latere reactie dat gebeurt uren na de eerste degranulatie.

Mestcellen kunnen genen aanzetten en eiwitten maken zoals IL-4, wat de productie van Th2-cellen stimuleert. Mestcellen produceren ook chemokinen zoals CCL3, die het signaal geven om monocyten en neutrofielen naar het gebied te brengen. GM-CSF, gemaakt in mestcellen, richt zich op beenmergstamcellen en vertelt hen om te differentiëren in basofielen en monocyten. Kortom, dit roept reservetroepen op voor de immuunrespons om de ziekteverwekkers te blijven bestrijden.

Prostaglandinen en leukotriënen worden ook gesynthetiseerd door mestcellen. Deze veroorzaken ontstekingen. Leukotriënen zijn 100 krachtiger dan histamine, maar hebben vergelijkbare acties. Prostaglandinen veroorzaken ontstekingen via vasodilatatie, vasculaire permeabiliteit en meer immuuncellen die aangetrokken worden om de infectie te bestrijden. Prostaglandine veroorzaakt ook pijn via binding aan sensorische neuronen. Prostaglandinen worden gesynthetiseerd uit arachidonzuur met behulp van cyclo-oxygenase (COX), en u kunt de prostaglandinerespons remmen via aspirine of NSAID's (bijv. ibuprofen).

Over het algemeen hebben mestcellen: 50 – 200 korrels in het cytoplasma van de cel die histamine, heparine, tryptase, cytokines, enz. opslaat. [ref] De afbeelding hieronder laat zien hoe het eruit ziet onder een microscoop wanneer een mestcel (paars gekleurd) degranuleert. [ref]

Allergieën: (Type I overgevoeligheidsreacties)

Naast het reageren op antigenen op een pathogeen, zoals een bacterie, kan het IgE ook worden geprimed om te koppelen met antigenen op eiwitten die geen pathogenen zijn. allergenen. Veel voorkomende allergenen zijn pollen, katten, huisstofmijten, noten, zuivel en vis. Het hele proces van 'allergisch worden voor iets' is behoorlijk ingewikkeld. Om het proces te starten, moet het gemeenschappelijke eiwit worden opgenomen door macrofagen of dendritische cellen, waardoor een antigeenpresentatie op MHC II-moleculen ontstaat. Dit gebeurt meestal met overgeërfde MHC II-types en bepaalde HLA-types. Wanneer deze antigenen worden gepresenteerd, kunnen ze een CD4-receptor tegenkomen die de CD4 T-cellen activeert. Dit zou de T-cel kunnen voorbereiden om een ​​TH2-helper-T-cel te worden als IL-4 aanwezig is. B-cellen doen hier ook iets: als ze ook het allergeeneiwit hebben dat ze hebben gefagocyteerd en gepresenteerd, dan bindt de B-cel zich aan de Th2-cel en creëert IgE. Het IgE bindt aan de mestcellen.

Als het allergeen terugkomt, bindt het zich aan die IgE op de mestcellen en veroorzaakt degranulatie. Wat er bij de allergische reactie gebeurt, hangt af van waar de mestcellen worden geactiveerd (darm, luchtwegen, huid, enz.). In de lucht verspreide allergenen binden zich bijvoorbeeld aan IgE op de mestcellen en veroorzaken een reactie. Neus = allergische rhinitis (zwelling, vocht, niezen) Longen Allergische astma, vocht en slijm diep in de longen, bronchiale vernauwing, hoesten.

Virussen en mestcellen:

Terwijl tekstboekinformatie over mestcelactivering gewoonlijk vermeldt: parasieten (wormen), bacteriën en allergenen, meer recent onderzoek toont aan dat virussen activeren ook mestcellen. Een paper uit 2015 laat zien dat het influenza A-virus mestcellen direct activeert, waardoor cytokinen vrijkomen en bijdragen aan de overmatige ontstekingsreactie in de longen. [ref] Dierstudies tonen aan dat dit patroon van mestcelactivering en overmatige respons geldt voor verschillende stammen van de griep. Bovendien verminderden mestcelremmers de longlaesies en sterftecijfers door de griep dramatisch. [ref] [ref]

Andere stoffen die mestcellen activeren:

De IgE-activering is slechts één manier een mestcel wordt geactiveerd tijdens zijn normale, ziekteverwekkende functie.

De volgende zijn bekende triggers van mestceldegranulatie (naast IgG-activering via pathogeen of allergeen): [ref] Acetylcholine, complementfragmenten (C3α, C4α, C5α), verschillende medicijnen, peptiden (inclusief endorfine, leptine, PTH en meer ), en fysieke omstandigheden (koude, hitte, druk, stress en trillingen).

Bovendien kan mestcelactivering plaatsvinden door IgG-antigeencomplexen, pathogeen-geassocieerde moleculaire patronen (PAMPS), cel-celcontact en hormonen. [ref]


Achtergrond

De RNA-wereld is een oude evolutionaire periode die wordt gekenmerkt door een op ribozym gebaseerd metabolisme. Men denkt dat de genetische code, of in ieder geval de voorlopers van de moderne adapters (d.w.z. tRNA's, Figuren 1 en 2), in dat stadium werden vastgesteld [[1], Ch. 5]. Er zijn verschillende theorieën die de huidige organisatie van de code verklaren in termen van selectieve voordelen, robuustheid tegen mutatie, laterale genoverdracht, biochemische en fysisch-chemische eigenschappen, enzovoort. De meeste van deze ideeën zijn gebaseerd op de veronderstelling dat er eerdere, misschien minder nauwkeurige of complexe codes bestonden, die evolueerden door te selecteren op verschillende organisatorische principes, wat leidde tot de moderne genetische code. Hoewel de meeste theorieën zich bezighouden met de herschikkingen van de code, gaan er maar weinig rechtstreeks in op de vraag hoe deze code is ontstaan. Tot op zekere hoogte kan de specifieke associatie tussen sommige aminozuren en hun codons worden verklaard door de vorming van covalente complexen van dinucleotiden en voorlopers van aminozuren [2]. Andere ideeën die meer aandacht hebben gekregen, zijn de stereochemische argumenten (de structurele affiniteit tussen aminozuren en coderende tripletten) [3-6]. Verder is voorgesteld dat de rol van aminozuren in een RNA-wereld was om de katalytische activiteit van ribozymen [7] te verbeteren, een functie die codering vereist, omdat ribozymen het aminozuur als co-factoren op een specifieke manier moesten binden.

Basisstructuur van het tRNA-molecuul.

Stadia van de evolutie van het tRNA-molecuul. (A) Oorspronkelijk bestond dit uit een trinucleotide bevestigd aan een aminozuur (B) het triplet langwerpig tot een mini-helix, waarschijnlijk omdat het structurele stabiliteit verleende (C) verdere verlengingen van de mini-helix resulteerden in de moderne tRNA-structuur. Dit werk speelt zich af in een fase zoals in (B). Voor details over de feitelijke mechanismen van de evolutie van het tRNA-molecuul, zie [6].

Ik stel voor dat een alternatieve oude functie voor de aminozuren in een eerdere RNA-wereld was om energie te oogsten. Ik stel een scenario voor waarin codering vereist is om de katabole afbraak van aminozuren uit te voeren, en dat gemakkelijk kan zijn voortgekomen uit initiële willekeurige toewijzingen.

Mijn betoog volgt uit drie observaties. Ten eerste worden aminozuren gekataboliseerd om energie te verkrijgen, en de metabolieten worden gebruikt als voorlopers voor andere biomoleculen, een rol die vaak over het hoofd wordt gezien vanwege de prominente en centrale positie van eiwitten in het metabolisme. Dit suggereert dat de aminozuren oorspronkelijk een bio-energetische, in plaats van katalytische rol hadden, waarbij de laatste later verscheen. In het bijzonder bacteriën van het geslacht Clostridium waarvan bekend is dat ze aminozuren direct gebruiken om metabolische energie te oogsten. Sommige van deze obligate anaëroben gebruiken geen glucose als koolstofbron, maar fermenteren eerder een paar moleculen waarvan het ene aminozuur fungeert als een elektronendonor en een ander als een elektronenacceptor. De algemene reactie, genaamd Stickland-fermentatie geeft energie vrij die de productie van ATP aandrijft (Figuur 3). De substraten voor de Stickland-reactie zijn specifieke paren aminozuren. Dat wil zeggen dat de reactanten één aminozuur moeten bevatten dat kan worden geoxideerd (meestal alanine, valine, leucine, serine, isoleucine of threonine) en een ander aminozuur dat kan worden gereduceerd (meestal glycine, proline of asparaginezuur, zie tabel 1. ) [8, 9].

De Stickland-reactie. In het geslacht Clostridium, aminozuurfermentatie vereist twee stappen. (A) Oxidatieve deaminering van het aminozuur met de hogere oxidatietoestand levert een α-ketozuur, ammonium en twee protonen. Als bijvoorbeeld R1 is een methylgroep (-CH3), dan is het donoraminozuur een alanine, en het product van de oxidatieve deaminering zou pyruvaat zijn, een centrale verbinding van het intermediaire metabolisme. (B) Anorganisch fosfaat hecht aan het carboxyl-uiteinde. Het tweede proton neemt de plaats in van de aminoradicaal. Het product van deze reactie is een acylfosfaat. Bijvoorbeeld wanneer R2 is een waterstof (dus het acceptoraminozuur is een glycine) dit product komt overeen met acetylfosfaat. De twee fosfaatverbindingen van A en B zijn substraten voor de synthese van ATP uit ADP. Natuurlijk, in Clostridium soorten. al deze reacties vinden plaats met behulp van hydrogenasen (voor de elektronendonoren) en reductasen (voor de elektronenacceptoren). ATP-synthese wordt gekatalyseerd door kinasen. In chemo-autotrofe systemen is het acetylfosfaat echter gemakkelijk de energiedrager (zie tekst).

Ten tweede worden aminozuren gemakkelijk geproduceerd onder tal van mogelijke scenario's voor de abiotische synthese van de bouwstenen van het leven. Het beroemde Miller-experiment [10] en andere Miller-Urey-synthesen [11–13] gebruiken energiebronnen om aminozuren uit gassen te genereren. De "ijzer-zwavel" chemo-autotrofe theorie [14], die compatibel is met de omstandigheden van hydrothermale ventilatieopeningen van zwarte rokers (extreem heet en zeer zuur), maakt gebruik van het reducerende vermogen van sulfiden en hoge temperaturen om organische moleculen te synthetiseren, waaronder amino zuren, via thio-esters. In de warme maar alkalische hydrothermale ventilatieopeningen (de witte rokers) een vergelijkbare vermindering van CO2 door sulfiden optreedt, en de reacties die plaatsvinden zijn analoog aan de acetogenese (Wood-Ljungdahl) route, waar de stikstoffixatie takken leiden tot aminozuren, die op hun beurt ook worden gebruikt als voorlopers om nucleotiden te synthetiseren [15].

In alle drie de scenario's worden gemakkelijk verschillende "Stickland-paren" gevormd. Met name de "Miller-aminozuren" [10] met de hoogste opbrengst (voornamelijk alanine, glycine, asparaginezuur en valine Figuur 4) kunnen vier Stickland-paren vormen: alanine+glycine, alanine+asparaginezuur, valine+glycine en valine+ asparaginezuur. Evenzo worden in de ijzerzwavelwereld glycine, serine en asparaginezuur gemakkelijk gesynthetiseerd [16], waar we vinden dat glycine + serine en glycine + asparaginezuur Stickland-reactieve paren zijn. Ten slotte worden naast glycine en alanine ook asparagine- en glutaminezuren gevormd in de alkalische hydrothermale ventilatieopeningen [15], die opnieuw de paren alanine+glycine en alanine+asparaginezuur en asparaginezuur+alanine vormen.

Opbrengst van aminozuren in het Miller-experiment. Opbrengst wordt gemeten in μmol producten zijn het resultaat van bruisend 336 mmol methaan, wat overeenkomt met een totaal van 1,55%. Gegevens uit tabel 1 van [13]. De grijze en witte balken vertegenwoordigen aminozuren die respectievelijk elektronendonors en acceptoren zijn in de Stickland-reactie. De opbrengst-as is in een logaritmische schaal.

De derde observatie is de cruciale anticodons die complementair zijn, vaak coderen voor aminozuren die geconjugeerde Stickland-paren hebben. Dit geldt met name voor de "Miller"-aminozuren (die de eenvoudigste zijn), en geldt ook voor complementaire anticodons waarbij niet-canonieke G-U-paren betrokken zijn. De correlatie tussen deze twee vormen van complementatie (de metabole of Stickland-complementatie en de anticodon-complementatie) is relevant omdat in de evolutie van de proto-adapters RNA-complementatie een rol speelde bij het diversifiëren van de anticodons [6, 17, 18].

Deze drie onafhankelijke feiten suggereren dat aminozuurfermentatie een rol zou kunnen hebben gespeeld bij het vaststellen van de genetische code. Het doel van dit artikel is om dit idee in meer detail uit te werken, de hypothese op een toetsbare manier te formuleren en de implicaties te analyseren die het heeft op ons huidige begrip over de context van het vroege metabolisme en op de factoren die de translationele machines.

Abiogenese van aminozuren

In de jaren 1920 stelden Oparin [19] en Haldane [20] voor dat onder zuurstofloze omstandigheden en met geschikte energiebronnen zich spontaan organische materie zou vormen, wat de basis zou zijn voor de eerste vormen van leven. Later synthetiseerde Miller [10] aminozuren uit een mengsel van vier elementaire gassen: ammoniak (NH3), methaan (CH4), water (H2O), en kooldioxide (CO2). Dit mengsel vormt een "reductieve atmosfeer", wat betekent dat de gevormde verbindingen een aanzienlijk potentieel hebben om redoxreacties te ondergaan. Sommige verbindingen zijn goede elektronendonoren, zoals ammoniak en methaan. Kooldioxide en moleculaire zuurstof zijn krachtige elektronenacceptoren. De aanwezigheid van elektronenacceptoren is van cruciaal belang voor organismen, omdat ze de oxidatie van koolstofbronnen (bijvoorbeeld glucose) tot water en koolstofdioxide mogelijk maken, en de gelijktijdige afgifte van vrije energie wordt gebruikt voor vitale metabolische processen. Hedendaags begrip suggereert echter dat methaan en ammoniak afwezig waren in de vroege Hadean-atmosfeer (ongeveer 4 miljard jaar geleden). In plaats daarvan wordt moleculaire stikstof (N2) was overvloedig [21]. In deze "zwak reducerende" atmosfeer N2 is een slechte elektronendonor, wat zowel de diversiteit als de opbrengst van de verbindingen die abiotisch kunnen worden gevormd, beperkt.

Hoe dan ook, door energie aan deze reducerende mengsels toe te voegen, worden aminozuren gesynthetiseerd die biologisch significant zijn. Dit geldt voor verschillende varianten van Millers experiment [11]. Miller-achtige experimenten geven meestal relatief hoge opbrengsten aan onder andere glycine, asparaginezuur, alanine en valine, afhankelijk van de energiebron en initiële mix [11-13, 22]. Figuur 4 geeft de relatieve opbrengsten weer van de reducerende atmosfeer, waarin enkele belangrijke aminozuren gemakkelijk worden gesynthetiseerd.

Het is echter de vraag onder welke atmosferische omstandigheden de oorsprong van de genetische code plaatsvond, en dus welke aminozuren relevant waren voor een vroege stofwisseling. Een mogelijkheid is dat de genetische code is vastgesteld net na het ontstaan ​​van het leven, in een pre-RNA-wereld in een prebiotische soepsetting, onder een zwak reducerende atmosfeer met lage opbrengsten aan glycine, asparaginezuur en alanine [11]. Dit is een onwaarschijnlijke mogelijkheid omdat er een abiotisch metabolisme met nucleïnezuren moest bestaan. De geologische omstandigheden in deze periode waren ook erg hard, gekenmerkt door vijandige vulkanische activiteit en hoge temperaturen. Men denkt dat deze omstandigheden te ongunstig zijn voor het ontstaan ​​van vroege levensvormen, hoewel het niet duidelijk is of autotrofe metabolismes daadwerkelijk hebben bestaan. Een andere mogelijkheid is dat de genetische code is vastgesteld in een late RNA-wereld, nadat de atmosfeer al was veranderd, misschien met inbegrip van methaan en ammoniak geproduceerd door het metabolisme van methanogene protobionten. Dit gebeurde, zoals we het begrijpen, tijdens de Archaïsche periode, ongeveer 3,5 miljard jaar geleden. Dit is een waarschijnlijker scenario omdat in een reeds bestaand metabolisme een nieuwe code zou resulteren uit de reorganisatie van gevestigde processen. Met andere woorden, de pre-aanpassingen die nodig waren om de genetische code vast te stellen, zijn consistent met vroege metabolismes.

Wächtershäuser vatte verschillende redenen samen en wees erop waarom Miller's "prebiotische soep" niet werkt als model voor prebiotische evolutie [14]. Hoewel deze redenen discutabel zijn, is het de moeite waard om te overwegen dat een prebiotische soep in feite niet het meest geschikte scenario is. Een sterk argument is dat de samenstelling van de primitieve atmosfeer [21] niet zou bestaan ​​uit de gassen die nodig zijn om oeraminozuren met voldoende opbrengst te synthetiseren. Als alternatief stelde Wächtershäuser voor wat de "primitieve pizza" werd genoemd [1, pp. 32-33]. Deze theorie stelt dat de prebiotische reacties niet in oplossing plaatsvinden, maar op het oppervlak van pyriet, mineralen die rijk zijn aan ijzer. Ferro-kationen (positief geladen) en zwavelanionen (negatief geladen) worden geadsorbeerd in het mineraaloppervlak en reageren om pyriet te vormen. Deze reactie, d.w.z. Fe 2+ + 2H2S →FeS2 + 4H + + 2e - , maakt twee elektronen vrij en is exergoon, waardoor energie direct beschikbaar is voor andere chemische reacties. Onder de mogelijke chemische routes kunnen de oppervlaktereacties aminozuren vormen. De meeste aminozuren zouden in principe gevormd kunnen worden. De eerste aminozuren die zouden worden gevormd op pyrietoppervlakken en die volgens voorlopige implicatie de eerste zouden zijn die in een oude genetische code zouden worden opgenomen, zouden serine en asparaginezuur zijn. Serine zou onmiddellijk worden gesplitst om glycine te produceren [14]. In experimentele syntheses van de theorie van Wächtershäuser werden enkele aminozuren daadwerkelijk verkregen: glycine, alanine en serine [16], en alanine, glutaminezuur, fenylalanine en tyrosine [23, 24].

Een ander chemo-autotroof scenario dat het bespreken waard is, doet zich feitelijk voor bij de alkalische hydrothermale ventilatieopeningen [15]. Ongetwijfeld omvat deze setting het meest uitgebreide beeld van de oorsprong van het energiemetabolisme. Geosynthese in de aardkorst zorgt voor serpentinisatie: silicaten van magnesium en ijzer worden geoxideerd door water en produceren H2. Deze moleculaire waterstof komt later vrij bij de hydrothermale ventilatieopeningen, waar het reageert met CO2 en ijzersulfide (FeS), waarbij thio-esters worden gevormd. Deze verbindingen vormen de basis voor de synthese van veel verbindingen en cofactoren, en koppelen ook de activering van acetaat met fosfaat om acetylfosfaat te geven, dat verder kan worden gehydrolyseerd om in acetaat te eindigen (CH3COH). Net als in het ijzer-zwavelscenario kan FeS ook de oxidatieve aminering van katalyseren α-ketozuren, resulterend in alanine, glycine, en asparagine- en glutaminezuur. Met name purines en pyrimidinen kunnen ook worden gevormd uit asparaginezuur en glycine (een route waarbij acylfosfaten betrokken zijn) [25].

Samengevat bieden deze verschillende scenario's contextuele kaders die de synthese van aminozuren ondersteunen. De kwestie van de opbrengst van de aminozuurproductie staat nog steeds, zelfs als deze theorieën plausibele routes onthullen voor de novo aminozuursynthese, hebben experimentele beoordelingen aangetoond dat de opbrengst nogal mager is in vergelijking met de eisen van moderne organismen. Maar was de relatief lage abiotische opbrengst aan aminozuren voldoende om protobionten in stand te houden op basis van RNA-metabolisme? Het antwoord op die vraag hangt sterk af van de rol van aminozuren op het moment dat de genetische code werd vastgesteld.

De Stickland-reactie

De rol van de aminozuren is onvermijdelijk geassocieerd met de structurele en katalytische aard van eiwitten. Gezien hun kleine omvang zou het absurd zijn om te bedenken dat vrije aminozuren een structurele rol zouden kunnen spelen. Maar vanwege hun fysisch-chemische eigenschappen kunnen vrije aminozuren geassocieerd met RNA-adaptameren helpen bij katalyse [7]. De theorie van de coderende co-enzymatische handvatten (CCH) stelt dat de aminozuren covalent aan trinucleotiden waren gebonden, op een manier die doet denken aan metabole cofactoren, zoals bijvoorbeeld nicotinamide-adenine-dinucleotide (NADH) of ATP [7, 26]. De trinucleotiden dienden als "handvatten" waardoor ribozymen zich niet-covalent aan de aminozuren hechten. Op deze manier zouden de aminozuren opnieuw kunnen worden gebruikt om katalyse te ondersteunen [27]. Elke ondubbelzinnige associatie tussen tripletten en het aminozuurrepertoire zou ervoor zorgen dat de juiste katalytische factoren voor specifieke functies zouden worden gebruikt. Dit veronderstelt dat er al een bescheiden gevarieerd repertoire van aminozuren beschikbaar was. De synthese van de meeste katalytisch belangrijke aminozuren is zeer uitgebreid en hun abiotische opbrengst is verwaarloosbaar (behalve asparaginezuur), een feit dat noodzakelijkerwijs de katalytische functies van de aminozuren uitstelt tot latere historische stadia.

Een andere fundamentele rol van het eiwit- en aminozuurmetabolisme is voeding. Aminozuren worden geoxideerd via de citroenzuurcyclus en omgezet in ureum (dat wordt verwijderd) en pyruvaat en andere ketozuren van de citroenzuurcyclus die worden gebruikt bij de anabole synthese van andere verbindingen. Aminozuren hebben een oxidatietoestand die vergelijkbaar is met die van glucose, wat suggereert dat ze fermentatie kunnen ondergaan, en in bestaande organismen bevordert hun afbraak de ATP-synthese.

Er zijn verschillende katabole routes van aminozuurafbraak. Hiervan is de Stickland-reactie het meest efficiënt, door de oxidatie van het ene aminozuur te koppelen aan de reductie van een ander. De aminozuren die worden geoxideerd ondergaan een deaminering door de aminozuurdehydrogenasen, waarbij bovendien twee elektronen en twee protonen [28-30] verloren gaan. Het resulterende ketozuur verliest vervolgens één koolstof aan CO2en leidt tot ATP-synthese door fosforylering op substraatniveau (Figuur 3A) [9, 29-31]. Deze reactie wordt vervolgens gekoppeld aan de "reductieve tak" door de elektronen en de protonen over te dragen naar het andere aminozuur, dat een reductieve deaminering ondergaat, gekatalyseerd door een reductase [32–35]. Het gereduceerde ketozuur heeft hetzelfde aantal koolstofatomen als het acceptoraminozuur. Normaal gesproken leidt de reductieve tak niet tot ATP (tenzij beide substraten glycine zijn), (Figuur 3B) [36].

De totale hoeveelheid vrije energie varieert afhankelijk van het specifieke paar aminozuren dat fermentatie ondergaat en de stoichiometrie van de reactie. Bijvoorbeeld, het vergisten van vier mol glycine leidt tot 3 mol ATP, het vergisten van glycine en alanine (in een stoichiometrische verhouding van 3:1 mol) leidt tot 1,7 mol ATP. Beide resulteren in een lagere opbrengst dan de fermentatie van twee mol glucose, wat leidt tot 5 mol ATP, maar nog steeds efficiënt in vergelijking met de opbrengst van de fermentatie van andere koolhydraten (bijvoorbeeld 3 mol lactaat geeft een opbrengst van 2,3 mol ATP) [ [36, 37], Ch. 12].

De energetische opbrengst is namelijk voldoende om organismen in stand te houden die uitsluitend aminozuren als energiebron gebruiken. Het meest aansprekende voorbeeld is het geslacht Clostridium die chemoautotrofe, anaërobe bacteriën omvat [38]. Verschillende soorten kunnen of moeten aminozuren gebruiken als koolstofbron [9, 30, 35, 39, 40]. Maar het geslacht Clostridium is geen monofyletische groep [40, 41], wat aangeeft dat de Stickland-reactie een onafhankelijke oorsprong kan hebben (een onwaarschijnlijke mogelijkheid vanwege de sequentieovereenkomst van de dehydrogenaten en reductasen [32]), verloren is gegaan in andere geslachten of is verworven door zijwaartse overdracht. Onder de soorten vinden we thermofiele en alkalifiele soorten, waarvan sommige geassocieerd zijn met hydrothermale ventilatieopeningen [37, 38, 40, 42, 43]. Dit plaatst de bestaande Stickland-reactiepaden nauwelijks in een diepe voorouderlijke tak van de levensboom, maar het is denkbaar dat analoge, zo niet voorouderlijke, versies van Stickland-reactiepaden niet alleen bestonden voordat de code werd vastgesteld, maar ook een rol hadden kunnen spelen. rol bij de totstandkoming van de code, voordat de katalyserende rol werd geïmplementeerd en de vertaling zich ontwikkelde.

Evolutie van de adapters

Het probleem van het gebruik van aminozuren is slechts één kant van de medaille. De andere kant is hoe aminozuren werden toegewezen aan coderende tripletten. Zelfs als de rol van aminozuren als vanzelfsprekend zou worden aangenomen, zoals bij CCH of de Stickland-fermentatie, blijft de vraag welke factoren dergelijke toewijzingen bepaalden. In ieder geval kan worden aangenomen dat de toewijzing op een bepaald moment een covalente binding tussen het aminozuur en de proto-adapters inhield. Er is gedebatteerd of de handvatten oude codons of anticodons waren [5, 26], maar stereochemische associaties geven de voorkeur aan het idee dat dit anticodons waren [5, 6]. Deze co-enzymatische handvatten werden later langwerpig om minihelices te vormen. Spiraalvormige structuren zouden structurele stabiliteit kunnen hebben verleend aan de proto-adapters (tRNA-precursoren), mogelijk voor coderende functies. De ideeën die in dit artikel worden geïntroduceerd, gaan uit van een mini-spiraalvormige fase voor de proto-adapters. De minihelices evolueerden uiteindelijk door opeenvolgende en recursieve duplicaties om de moderne adapters te vormen met hun klaverbladstructuur, de tRNA's (Figuur 2, [6]). Dit idee is gebaseerd op een recentelijk voorgesteld mechanisme. Het stelt dat de voorouder van de adapters een primordiaal palindroomgen was dat uit 11 nucleotiden bestond. Deze kleine haarspeld zou bestaan ​​uit twee bloksequenties: een coderend triplet (de CCH, zeg maar, GCC), en een replicatietag (zoiets als een promotorsequentie) met sequentie 5'-DCCA-3' (waarbij D ofwel een A is of een U). Als het precoderende triplet is gekoppeld tussen de tag en de complementaire sequentie van de tag, wordt een kleine haarspeld van 11 nucleotiden gevormd: UGGGDGCCdCCA (waarbij d het complement van D aangeeft). Nu is de tag plus triplet (7 nucleotiden) complementair aan het blok van 11 nucleotiden en kan aan een van de uiteinden worden geligeerd en een haarspeld van 18 nucleotiden vormen. Als dit patroon wordt herhaald, kan het 76 nucleotiden lange molecuul, het tRNA, worden gebouwd [6]. Met name in elke iteratie van dit duplicatie-verlengingsmechanisme evolueren twee proto-adaptermoleculen samen (één in elke streng), wat de al lang bestaande hypothese ondersteunt dat aminozuren in paren in de code waren opgenomen [6, 18, 44 –47].

Omdat een haarspeld een complementaire sequentie aan beide strengen heeft, is een paar proto-adapters met complementaire anticodons volledig complementair.Verder moet deze dubbele RNA-helix een palindroom zijn geweest (zie figuur 5). Wat opvalt, is dat moderne paren van tRNA's met complementaire anticodons ook complementair zijn op de aminozuurbepalingssequenties aan de stengel [6, 18, 45, 46]. Dit suggereert dat de sequenties aan de stengel overeen moeten komen met de voorlopers van een anticodon. Deze correlatie is sterker wanneer het niet-canonieke paar G-U is toegestaan ​​in de helices [45, 48, 49]. De implicatie, zoals hieronder beschreven, is dat de redundantie van de code kan worden verklaard in termen van de co-evolutie van de anticodon-precursoren [18, 45, 46]. Ten eerste wordt aangenomen dat proto-adapters met complementaire anticodons bij replicatie intermediaire dubbelstrengs helices vormen. Low-fidelity RNA-replicators produceerden niet-toegewezen anticodons, misschien door mutaties, maar voornamelijk door gebruik te maken van G-U-koppeling [6]. Ten tweede werden deze niet-toegewezen codons toegewezen aan nieuwe aminozuren, terwijl hun complementen, die vergelijkbaar waren met de oorspronkelijke proto-adapter, werden toegewezen aan de oorspronkelijke aminozuren [18, 45]. Denk bijvoorbeeld aan GCC, een anticodon toegewezen aan glycine. Dit codon kan een aanvankelijk niet-toegewezen triplet produceren door sjabloonreplicatie: GGU. De laatste produceert, door de juiste Watson-Crick-matching, ACC, een ander anticodon voor glycine. Het intermediaire anticodon GGU werd vervolgens toegewezen aan een nieuw aminozuur (in dit geval threonine). Dit mechanisme kan worden uitgebreid tot andere anticodons en kan op een spaarzame manier de incorporatie van verschillende aminozuren in paren verklaren, hoewel het niet verklaart waarom specifieke paren (bijvoorbeeld glycine en threonine) werden toegewezen aan het paar anticodons ACC en GGU.

Primordiaal palindroom-gen. Twee minihelices die complementaire anticodons hebben maar verder identiek zijn, kunnen zich ontvouwen en dimeriseren om een ​​dubbele RNA-helix te vormen. Deze dubbele helix is ​​een palindroom.


Discussie

We hebben het model MTSplice geïntroduceerd dat kwantitatief de effecten van menselijke genetische varianten op RNA-splitsing in 56 weefsels voorspelt. MTSplice heeft twee componenten. Eén component, MMSplice, modelleert constitutieve splitsingsregulerende sequenties. De andere component, TSplice, modelleert weefselspecifieke splitsingsregulatiesequenties. Het gecombineerde model MTSplice presteert beter dan MMSplice bij het voorspellen van weefselspecifieke variaties in het percentage gesplitst in verband met natuurlijk voorkomende genetische varianten in de meeste weefsels van de GTEx-dataset. Door MTSplice toe te passen op de novo-mutaties van simplex-families van autismespectrumstoornissen [55], vonden we een significant hogere last voor de proband-groep in vergelijking met de controlebroers en zussen, vooral in hersenweefsels. Deze resultaten suggereren dat MTSplice kan worden toegepast voor het scoren van varianten met een weefselspecifieke pathogene rol.

Verschillende bewijslijnen gaven aan dat ons model het beste presteerde voor hersenweefsels. Dit kan een weerspiegeling zijn van het feit dat hersenweefsel goed vertegenwoordigd is in GTEx, maar ook dat weefselspecifieke alternatieve splicing bijzonder sterk is in hersenweefsel, wat meer bruikbare sequenties geeft om op te trainen. Ondersteunend hiervoor onthulde modelinterpretatie dat sequentie-elementen waarvan bekend is dat ze zijn gebonden door hersenspecifieke splicingfactoren, hebben bijgedragen aan TSplice-voorspellingen. Voor andere weefsels waren de verbeteringen gematigder maar consistent. Een uitzonderlijk weefsel is de testis, waarvoor MMSplice nog steeds een aanzienlijk betere RMSE heeft dan MTSplice voor voorspellingen van variante effecten. We konden die observatie niet rationaliseren. Misschien kan dit te wijten zijn aan de unieke transcriptionele staat van de testis die de splicing kan beïnvloeden op een manier die het model niet leerde [57].

De TSplice-component werd getraind op basis van weefselspecifieke alternatieve splicing die werd waargenomen in de ASCOT-dataset. Deze benadering heeft twee belangrijke beperkingen. Ten eerste tonen slechts minder dan tienduizend exons weefselspecifieke alternatieve splicing in de ASCOT-dataset. Deze hoeveelheid gegevens verbiedt het trainen van complexere modellen. Ter vergelijking: MMSplice werd getraind met behulp van meer dan 2 miljoen sequenties van een massaal parallelle reportertest en meer dan een half miljoen natuurlijk voorkomende splitsingsplaatsen. Om deze beperking te overwinnen, zou men complementaire gegevens kunnen gebruiken, met name weefselspecifieke expressie van splicing-gerelateerde RNA-bindende eiwitten (RBP's) gecombineerd met transcriptoom-brede RBP-bindingsprofielen [58]. Een voorbeeld van een transfer learning-benadering in deze context wordt gegeven door Jha et al. [59], die de voordelen liet zien van het integreren van CLIP-Seq-gegevens om splicing te voorspellen. De tweede beperking is dat de ASCOT-dataset een observationele dataset is. Modellen die zijn getraind op basis van observatiegegevens met genomische sequenties, kunnen sequentiekenmerken leren die correlatief maar niet causaal zijn, waardoor de modellen het effect van genetische varianten niet correct kunnen voorspellen. Dit zou kunnen leiden tot beperkte voorspellende prestaties van ons huidige model.

Een benadering om het probleem van observatiegegevens te overwinnen, is het uitvoeren van massaal parallelle reporterassays (MPRA) voor verschillende celtypen. MPRA voor menselijke splicing is uitgevoerd in HEK293-cellen [26, 28, 60-62], K562-cellen [63, 64], HepG2-cellen [63] en HELA- en MCF7-cellen [65]. Deze gegevens bieden krachtige middelen om complexe modellen op splicing te trainen, maar diversiteit in weefsel en celtype ontbreekt nog steeds. Weefselspecifieke MPRA-gegevens zouden ook van het grootste belang zijn voor benchmarkingmodellen. Hier moesten we vertrouwen op natuurlijk voorkomende varianten in GTEx voor benchmarking. Weefselspecifieke wijziging van splitsing kan het resultaat zijn van genetische variatie die ofwel (i) constitutieve splitsingsregulerende elementen van weefselspecifieke exons of (ii) weefselspecifieke splitsingsregulerende elementen beïnvloedt. Zeer weinig GTEx-varianten kwamen uit de laatste klasse. Daarom kunnen de gemiddelde vierkante foutverschillen in GTEx tussen MTSplice en MMSplice slechts zeer mild zijn. Eerdere MPRA-splitsingsexperimenten met twee cellen vonden geen weefselspecifieke varianteffecten tussen K562- en HepG2-cellen [63], misschien ook omdat de geteste varianten willekeurig werden geselecteerd. Een ontworpen MPRA zou echter specifiek variaties van weefselspecifieke splitsingsregulatie-elementen kunnen ontwerpen door gebruik te maken van voorkennis om het effect van varianten op weefselspecifieke splitsingsregulatie dieper te onderzoeken. Het genereren van grootschalige weefsel- of celtype-specifieke verstoringsgegevens zou daarom instrumenteel kunnen zijn voor het onderzoeken van weefselspecifieke regulerende elementen en zou gevoeligere benchmarks van voorspellende modellen kunnen opleveren. Afgezien van verbeteringen aan de kant van trainingsgegevens, kunnen toekomstige modellen mogelijk betere architectuur en technieken voor gegevensvergroting ontwerpen om de prestaties verder te verbeteren. Ten slotte, omdat de benadering om weefselspecifieke varianteffecten te voorspellen door MMSplice te combineren met een voorspellingsmodel op weefselsplitsingsniveau algemeen is, kan elk model dat weefselspecifieke logit(Ψe,t) zou kunnen vervangen door TSplice en worden gecombineerd met MMSplice om weefselspecifiek varianteffect op splitsing te voorspellen.


HET BOEK DES LEVENS LEZEN: HET OVERZICHT Genetische code van het menselijk leven is gekraakt door wetenschappers

In een prestatie die het toppunt van menselijke zelfkennis vertegenwoordigt, zeiden twee rivaliserende groepen wetenschappers vandaag dat ze het erfelijke schrift hadden ontcijferd, de reeks instructies die het menselijk organisme definieert.

"Vandaag leren we de taal waarin God het leven schiep", zei president Clinton tijdens een ceremonie in het Witte Huis die werd bijgewoond door leden van de twee teams, Dr. James D. Watson, mede-ontdekker van de structuur van DNA, en, via satelliet, premier Tony Blair van Groot-Brittannië. [Uittreksels, pagina D8.]

De leiders van de teams, Dr. J. Craig Venter, president van Celera Genomics, en Dr. Francis S. Collins, directeur van het National Human Genome Research Institute, prezen elkaars bijdragen en gaven blijk van een geest van samenwerking vanaf nu , ook al zullen de twee inspanningen stevig onafhankelijk blijven.

Het menselijk genoom, het oude schrift dat nu is ontcijferd, bestaat uit twee sets van 23 gigantische DNA-moleculen of chromosomen, waarbij elke set - één geërfd van elke ouder - meer dan drie miljard chemische eenheden bevat.

De succesvolle ontcijfering van dit enorme genetische archief getuigt van het buitengewone tempo van de vooruitgang van de biologie sinds 1953, toen de structuur van DNA voor het eerst werd ontdekt en een tijdperk van nog snellere vooruitgang voorspelt.

Het begrijpen van het menselijk genoom zal naar verwachting een revolutie teweegbrengen in de praktijk van de geneeskunde. Biologen verwachten op termijn een scala aan diagnostiek en behandelingen te ontwikkelen die hierop zijn gebaseerd en toegespitst zijn op individuele patiënten, waarvan sommige gebruik zullen maken van de eigen mechanismen van zelfherstel van het lichaam.

De kennis in het genoom kan ook op schadelijke manieren worden gebruikt, met name bij het blootleggen van de aanleg van patiënten voor ziekte als hun privacy niet wordt gewaarborgd, en bij het veroorzaken van discriminatie.

De gezamenlijke aankondiging is een soort jachtgeweerhuwelijk, omdat geen van beide kanten van het menselijk genoom compleet is, noch zijn ze het eens over de grootte van het genoom. Geen van beide heeft de sequentie bepaald - wat betekent om de volgorde van de chemische subeenheden te bepalen - het DNA van bepaalde korte structurele regio's van het genoom, die nog niet kunnen worden geanalyseerd.

Met de rest van het genoom, dat de menselijke genen en nog veel meer bevat, hebben de versies van beide kanten veel kleine lacunes, hoewel men denkt dat deze weinig of geen genen bevatten. De versies van vandaag zijn in feite complete representaties van het genoom, maar laten veel meer werk te doen.

De twee groepen verschillen zelfs van elkaar over de grootte van het gencoderende deel van het genoom. Celera zegt dat het 3,12 miljard DNA-letters is, het openbare consortium dat het 3,15 miljard eenheden zijn, een letterverschil van 30 miljoen. Geen van beide partijen kan de volledige grootte van het genoom beschrijven of het aantal menselijke genen bepalen.

Het publieke consortium is ook wat achtergebleven in zijn doel om tot een werkconcept te komen waarin 90 procent van het genbevattende deel van het genoom werd gesequenced. Zijn versie heeft vandaag slechts 85 procent bereikt, wat suggereert dat het volgens Celera's tijdschema marcheerde.

De aankondiging van vandaag luidde een onverwachte wapenstilstand in tussen de twee groepen wetenschappers die hebben geracet om het genoom af te maken. De twee wendden zich af van het vooruitzicht om rivaliserende claims van overwinning te claimen en kozen ervoor om gelijktijdig te rapporteren dat ze verschillende mijlpalen in hun zoektocht hadden bereikt.

Celera, een onderdeel van de PE Corporation, heeft zijn 3,12 miljard letters van het genoom verkregen in de vorm van lange aaneengesloten reeksen, meestal ongeveer 2 miljoen letters elk, maar met veel kleine gaten.

Een minder volledige versie is gerapporteerd door het Human Genome Project, een consortium van academische centra dat grotendeels wordt ondersteund door de National Institutes of Health en de Wellcome Trust, een medische filantropie in Londen. Dr. Collins, de leider van het consortium, zei dat zijn wetenschappers 85 procent van het genoom hadden gesequenced in een 'working draft', wat betekent dat de nauwkeurigheid later zal worden verbeterd.

Beide versies van het menselijk genoom beantwoorden aan het belangrijke doel om wetenschappers in staat te stellen ze te zoeken naar de gewenste genen, de genetische instructies die in het DNA zijn gecodeerd. De genoomgegevens van het consortium zijn nu vrij beschikbaar. Celera heeft gezegd dat het op een later tijdstip een versie van zijn genoomsequentie vrij beschikbaar zal maken.

In hun opmerkingen in het Witte Huis probeerden Dr. Collins en Dr. Venter beiden de bredere betekenis van hun werk te vatten door de oogverblindende stroom van A's, G's, C's en T's, de letters in de vierletterige code van het genoom.

''We hebben de eerste glimp opgevangen van ons instructieboek, dat voorheen alleen aan God bekend was,'', zei Dr. Collins. Dr. Venter sprak over zijn overtuiging van het zien van mensen die sterven in Vietnam, waar hij als medicus diende, dat de menselijke geest de fysiologie overstijgt die wordt gecontroleerd door het genoom.

De twee genoomversies werden verkregen door wonderbaarlijke inspanningen van beide kanten, waarbij bekwaam management van teams van wetenschappers betrokken was die de klok rond werkten aan een nieuwe technologische grens.

Hun inspanningen werden gestimuleerd door de glinsterende aantrekkingskracht van het genoom als wetenschappelijke prijs, en een rivaliteit die werd aangewakkerd door persoonlijke verschillen en tegenstrijdige agenda's.

Dr. Venter, een pionier op het gebied van genomica wiens innovatieve methoden soms werden geminacht door experts in het kamp van het consortium, heeft zichzelf vaak, niet zonder reden, neergezet als een buitenstaander die strijdt tegen een vijandig establishment.

De wetenschappers van het consortium waren halverwege een succesvol 15-jarig programma om het menselijk genoom tegen 2005 af te ronden, toen Dr. Venter in mei 1998 aankondigde dat hij als hoofd van een nieuw bedrijf, later Celera genaamd, hen binnen 5 jaar zou verslaan. .

Zijn bombshell-inzending veranderde een academische achtervolging in een felle race. Dr. Collins reageerde door zijn voltooiingsdatum vooruit te schuiven naar 2003 en deze maand als doel te stellen voor een ontwerp van 90 procent.

'⟞ze mensen hebben alles uit de kast gehaald, vertelde hij vorige week over zijn staf in een interview. ''Ze hebben een stijging bereikt die verder gaat dan je ooit voor mogelijk had gehouden.''

De 15-jarige kosten van het Human Genome Project, dat in 1990 begon, worden geschat op $ 3 miljard, maar omvatten veel incidentele kosten. Het consortium heeft sinds januari 1999, toen de volledige productiefase begon, slechts $ 300 miljoen uitgegeven aan het sequencen van het menselijk genoom. Celera heeft de kosten niet vrijgegeven, maar Dr. Venter zei een jaar geleden dat hij verwachtte dat het menselijke genoom van Celera tussen de 200 en 250 miljoen dollar zou kosten.

De race begon met wederzijdse voorspellingen van een nederlaag. De senior wetenschappers van het consortium voorspelden in december 1998 dat de methode van Dr. Venter om de fragmenten van genomisch DNA opnieuw te assembleren, onvermijdelijk zou mislukken. In mei 1999 merkte Dr. Venter, overtuigd van het op handen zijnde succes van Celera, op dat de National Institutes of Health en de Wellcome Trust goed geld op kwaad zetten.

De groepen waren verdeeld door zowel politieke als technische agenda's. De twee hoofdwetenschappers van het consortium, Dr. John E. Sulston van het Sanger Center in Engeland en Dr. Robert Waterston van de Washington University in St. Louis, stonden erop dat de genoomgegevens elke avond gepubliceerd zouden worden, een buitengewoon genereus beleid omdat wetenschappers over het algemeen nieuwe gegevens verzamelen voor hun eigen ontdekkingen voordat ze deze delen.

De beide administratieve leiders van het consortium, Dr. James D. Watson, en zijn opvolger, Dr. Collins, maakten er een punt van om internationale partners te zoeken, zodat de rest van de wereld zich niet uitgesloten zou voelen van de genoomtriomf. Dus hoewel centra in de Verenigde Staten en Groot-Brittannië het meeste zware werk hebben gedaan, zijn belangrijke bijdragen aan het genoomontwerp van het consortium geleverd door centra in Duitsland, Frankrijk, Japan en China.

Academische wetenschappers hebben enige ergernis gevoeld dat een altruïstische, open en technisch succesvolle onderneming als het Human Genome Project moet worden overtroffen door een commerciële rivaal die wordt gefinancierd door het bedrijf dat de DNA-sequencing-machines van het consortium heeft gemaakt.

Maar hoewel Celera winst wil maken door een genomische database te exploiteren, geloofde Dr. Venter ook dat hij het genoom en de voordelen ervan veel eerder beschikbaar zou kunnen maken. Hij is daarin geslaagd en heeft het consortium ertoe aangezet om sneller te handelen.

De huidige wapenstilstand tussen de twee teams biedt verschillende voordelen. Als Celera de overwinning op het consortium zou claimen, zou dat het risico lopen klanten in de academische gemeenschap te vervreemden. Voor het consortium leek de zekerheid om nu voor een gelijkspel te kiezen misschien beter dan de risico's om veel later de overwinning te claimen met een volledig genoom.

De versie van het genoom van Celera is afhankelijk van de gegevens van het consortium. En de vele kleine hiaten in de volgorde van Celera zullen waarschijnlijk worden opgevuld door de wetenschappers van het consortium, wat bijdraagt ​​aan hun claim op krediet voor het eindproduct.

De huidige wapenstilstand tussen de partijen is beperkt tot de aankondiging van vandaag en een overeenkomst om hun rapporten in hetzelfde tijdschrift te publiceren, hoewel de details nog moeten worden uitgewerkt. Er wordt een gezamenlijke workshop gehouden om de genoomversies te bespreken.

De versies van het menselijk genoom die door de twee teams zijn geproduceerd, zijn in verschillende stadia van voltooiing vanwege de verschillende methoden die elk worden gebruikt om de volgorde van DNA-eenheden in het genoom te bepalen.

Het consortium koos ervoor om eerst het genoom op te splitsen in grote brokken, de zogenaamde BAC's, die ongeveer 150.000 DNA-letters lang zijn, en om elke BAC afzonderlijk te sequencen. Deze BAC by BAC-strategie vereiste ook het in kaart brengen van het genoom, of het definiëren van korte sequenties van mijlpaal-DNA die zouden helpen aantonen waar elke BAC thuishoorde op zijn ouderchromosoom, de gigantische DNA-moleculen waaruit het genoom is samengesteld.

BAC's zijn samengesteld uit duizenden DNA-fragmenten, elk ongeveer 500 DNA-letters lang. Dit is de langste reeks DNA-letters die de DNA-sequencingmachines kunnen analyseren. Een computer voegt de fragmenten samen door te zoeken naar overeenkomsten in de DNA-sequentie waar het ene fragment het andere overlapt.

Maar de BAC's komen niet netjes samen uit hun componentfragmenten. Een van de redenen is dat het menselijk DNA vol zit met zich herhalende reeksen - dezelfde reeks letters die steeds opnieuw wordt herhaald - en deze herhalingen verbijsteren de computeralgoritmen die zijn ingesteld om de stukjes samen te stellen.

Het stadium dat het consortium nu heeft bereikt, is dat al zijn BAC's in kaart zijn gebracht, waardoor het hele genoom beschikbaar is in een geneste set van kleinere legpuzzels. Maar de BAC's bevinden zich in verschillende stadia van voltooiing. De BAC's die de twee kleinste menselijke chromosomen, de nummers 21 en 22, bedekken, zijn in wezen compleet. Maar veel andere BAC's bevinden zich in minder onberispelijke staat van montage. Vele bestaan ​​uit geassembleerde stukken van niet meer dan 10.000 eenheden, en de volgorde van deze stukken binnen elke BAC is niet bekend.

De som van de verzamelde stukjes in elke BAC dekt nu 85 procent van het genoom. Dit werkconcept, zoals het consortium het noemt, is misschien niet zo mooi, maar van grote waarde voor onderzoekers die op zoek zijn naar genen en een prestatie van formaat.

Het genoom van Celera is op een andere manier samengesteld, de zogenaamde whole genome shotgun-strategie. Volgens een schema dat is voorgesteld door Dr. Eugene Myers en Dr. J.L. Weber, slaat Celera de tijdrovende mapping-fase over en breekt het hele genoom op in een reeks fragmenten van 2.000, 10.000 en 50.000 letters lang. Deze fragmenten worden afzonderlijk geanalyseerd en vervolgens samengevoegd in een enkele gigantische computerrun, met een handvol slimme trucs om door de repetitieve sequentiegebieden in het DNA te stappen.

De aanpak vereiste idealiter het sequencen van 30 miljard eenheden DNA - 10 keer zoveel in een enkel genoom. Dr. Venter lijkt een aanzienlijk risico te hebben genomen door eind maart van dit jaar met zijn assemblage te beginnen, toen hij slechts een drievoudige dekking van het genoom bezat. Sindsdien heeft hij zijn totaal verhoogd tot 4,6-voudige dekking.

De beslissing kan zijn beïnvloed door Celera's kapitaaluitgaven - de elektriciteitsrekening van het bedrijf alleen al is $ 100.000 per maand - en door de noodzaak om zowel het muisgenoom te sequensen om databaseklanten een twee-genoom te bieden pakket.Het muizengenoom zal naar verwachting van onschatbare waarde zijn voor het interpreteren van het menselijk genoom, en Dr. Venter zei vandaag dat Celera het sequentiëren tegen het einde van het jaar zou afronden.

Omdat Celera relatief weinig eigen gegevens had, maakte Celera gebruik van de openbaar beschikbare sequentiegegevens van het consortium en, indirect, van de positie-informatie in de in kaart gebrachte set BAC's van het consortium. Het consortium kan terecht delen in de eer voor Celera's versie van het genoom, een andere overtuigende factor in de logica van de huidige wapenstilstand.

Biotech-aandelen stijgen en dalen

Aandelen van biotechnologiebedrijven stegen gisteren vroeg na een aankondiging van het Witte Huis dat het eerste onderzoek van het menselijk genoom was voltooid, maar beleggers verzilverden een deel van hun winst voordat de handel eindigde, waardoor verschillende problemen daalden.

Biotechnologieaandelen bereikten in maart een piek in speculatieve razernij, voordat ze sterk terugvielen. In de afgelopen weken noteerden ze opnieuw aanzienlijke stijgingen in afwachting van de aankondiging van het genoom.

De Celera Genomics-eenheid van de PE Corporation, die deelnam aan het karteringsproject en een van de hoogste vliegers is, daalde gisteren $ 12,25 naar $ 113. De aandelen van het bedrijf, gevestigd in Rockville, Maryland, bereikten op 25 februari een recordhoogte van $ 252 per aandeel. Hoewel de aandelen van Celera ruimschoots boven het hoogste punt stonden, zijn ze nog steeds 1.400 procent hoger dan vorig jaar rond deze tijd.


Over de oorsprong van degeneratie in de genetische code

De degeneratie van aminozuurcodering is een van de meest cruciale en raadselachtige aspecten van de genetische code. Er zijn verschillende theorieën ontwikkeld over de oorsprong van de genetische code. Tot op heden is er echter geen alomvattende hypothese over het mechanisme dat de degeneratie zou kunnen hebben veroorzaakt zoals we die waarnemen. Hier bieden we een nieuwe theorie die de oorsprong van de degeneratie verklaart, alleen gebaseerd op symmetrieprincipes. De benadering maakt het mogelijk om exact de degeneratie van de vroege code (voorloper van de genetische code van LUCA, de laatste universele gemeenschappelijke voorouder) te beschrijven, waarvan wordt aangenomen dat deze dezelfde degeneratie heeft als de huidige mitochondriale genetische code van gewervelde dieren. De theorie is gebaseerd op de tessera-code, die past als de stamvader van de vroege code. Bovendien beschrijven we in detail de mogelijke evolutionaire overgangen die door onze theorie worden geïmpliceerd. De aanpak wordt ondersteund door een uniform wiskundig raamwerk dat de degeneratie-eigenschappen van zowel nucleaire als mitochondriale genetische codes verklaart. Ons werk biedt een nieuw perspectief op het begrip van de oorsprong van de genetische code en de rol van symmetrieprincipes in de organisatie van genetische informatie.

1. Inleiding

Bestaande genetische codes kunnen worden gezien als een afbeelding tussen twee verschillende sets: de 64 mogelijke mRNA-codons en de 20 aminozuren plus de stopsignalen die nodig zijn voor eiwitsynthese. Aangezien de kardinaliteit van de startset van codons (64) groter is dan de kardinaliteit van de aankomende set aminozuren (20 + 1), is het in kaart brengen noodzakelijkerwijs gedegenereerd. Met andere woorden, sommige aminozuren worden gecodeerd door twee of meer codons. Degeneratie is een concept dat voor het eerst werd geïntroduceerd in de kwantummechanica. Een energieniveau van een kwantumsysteem is gedegenereerd als het overeenkomt met twee of meer verschillende kwantumtoestanden met dezelfde energie. Gedegenereerde kwantumtoestanden worden beschreven door verschillende oplossingen van de Schröedinger-vergelijking, verbonden door een symmetrietransformatie, dat wil zeggen, kwantumdegeneratie is in wezen een gevolg van symmetrie. Het is dus natuurlijk om te vragen of de degeneratie van de genetische code ook gerelateerd kan zijn aan symmetrie-eigenschappen. Ook al zijn er veel theorieën over de oorsprong van de genetische code en eiwitcodering naar voren gebracht, de oorsprong van degeneratie blijft een zeer ongrijpbaar probleem.

Symmetrie is een meta-principe dat alle takken van de natuurkunde doordringt: van klassieke mechanica tot kwantumtheorie, van relativiteit tot deeltjesfysica, het is algemeen bekend dat symmetrieprincipes worden aangeroepen om behoudswetten te verklaren. In de klassieke mechanica is energiebesparing bijvoorbeeld gerelateerd aan de Hamiltoniaanse invariantie onder tijdtranslatie, ook is het behoud van lineaire en hoekmomenten gerelateerd aan de Hamiltoniaanse invariantie onder respectievelijk ruimtetranslaties en ruimterotaties. In overeenstemming met de universele rol die symmetrieprincipes in de natuurkunde spelen, denken we dat deze benadering kan bijdragen aan het begrijpen van enkele belangrijke onopgeloste biologische problemen.

Er zijn verschillende pogingen ontwikkeld om de genetische code te beschrijven in termen van symmetrie-eigenschappen en groepentheorie [1-3]. Merk op dat deze benadering niet altijd goed is ontvangen door biologen, misschien vanwege de moeilijkheid om een ​​biologische interpretatie te geven aan modellen die hun toevlucht nemen tot een onwaarschijnlijke keten van symmetriebrekende stappen in dit opzicht, de kritiek van Maddox [4] die deze inspanningen betreft als een 'waardevolle oefening in classificatie' is goed gepositioneerd. We stellen echter dat de analyse op basis van de symmetrie-eigenschappen fundamenteel is voor het begrip van de oorsprong en structuur van de genetische code. In dit werk beschrijven we de oorsprong van degeneratie door een nieuwe benadering te gebruiken op basis van symmetrie die een exacte kwantitatieve beschrijving mogelijk maakt van enkele fundamentele kenmerken, zoals de degeneratieverdeling. Een van de weinige werken die de studie van degeneratie behandelen door symmetrie-eigenschappen te gebruiken, zijn [5-7]. Voor verdere werken over symmetrie en symmetriebreking in de genetische code, zie onder andere [8-14].

Het valt niet te ontkennen dat de huidige vorm van de genetische code op zijn minst gedeeltelijk te wijten is aan historische toevalligheden. We kunnen ons afvragen: 'Als het leven op aarde opnieuw zou ontstaan, wat zou dan de structuur zijn van het eiwitsynthese-apparaat (ervan uitgaande dat die er zou zijn)? Zou er een universele genetische code zijn die degeneratie vertoont?” Blijkbaar kan niemand deze vraag beantwoorden, maar het is aannemelijk om enkele structurele overeenkomsten met het bestaande apparaat aan te nemen vanwege de beperkingen die worden opgelegd door de universele wetten van scheikunde en natuurkunde die nog steeds gelden. .

Theorieën over de oorsprong van de genetische code kunnen worden gegroepeerd in ten minste vijf verschillende categorieën. (1) De stereochemische oorsprong: het is gebaseerd op de hypothese dat codons (of ook anti-codons) selectief kunnen binden aan toegewezen aminozuren via een stereochemische specificiteit [15,16]. Merk op dat er een correlatie is gevonden tussen sommige aminozuren en aptameren die codon/anticodon-motieven bevatten in [17] en dit biedt enige ondersteuning voor een dergelijke hypothese. (2) De co-evolutietheorie: het postuleert dat de codontoewijzing aan nieuwe aminozuren plaatsvindt door een deel van de codonset te erven die betrekking heeft op de voorloperaminozuren (aminozuren die de nieuwe genereren door biosynthetische modificatie) [18,19] . Zie ook [20] voor de temporele volgorde van aminozuren. (3) De adaptieve hypothese: het postuleert dat de belangrijkste evolutionaire druk het minimaliseren van mutatiefouten is, bovendien impliceert het dat vergelijkbare aminozuren worden gecodeerd door vergelijkbare codons [21]. (4) De operationele code: het stelt een voorouderlijk verband voor tussen de operationele code (die voornamelijk in de acceptorstam de affiniteit met het verwante aminozuur bepaalt) en de genetische code (geïmplementeerd met de codon-anticodon-koppeling) [22-25] . (5) Het bevroren ongeval: het postuleert een willekeurige oorsprong van de codontoewijzing aan aminozuren en een opeenvolgende evolutie als gevolg van verschillende evolutionaire druk, tot een punt waarop elke verdere wijziging schadelijk wordt (bepalend voor het bevriezen van de code) [16] . Opmerkelijk is dat geen van de hierboven beschreven benaderingen is gericht op de degeneratiedistributie als een belangrijk kenmerk. Degeneratie is meer een gevolg dan een eigenschap die rechtstreeks verband houdt met de fysisch-chemische oorsprong van de code. We merken twee uitzonderingen op, namelijk [5,7], de laatste verwijst echter naar een biochemische verklaring van degeneratie voor bestaande codes en is dus niet direct gerelateerd aan de evolutie van de code

Het evolutionaire pad van de genetische code kan worden onderverdeeld in twee hoofdperiodes, namelijk de oude periode, vanaf het begin tot het verschijnen van de universele genetische code van LUCA (de laatste universele gemeenschappelijke voorouder), en de moderne periode, vanaf deze universele genetische code. code en verder [26]. Voor een recente discussie over de definitie van LUCA, zie [27]. Volgens [7] kan de oeroude periode verder worden onderverdeeld door een derde, tussenliggende, periode op te nemen vlak voor de vergelijking van de genetische code van LUCA. In deze fase onderging de code een soort optimalisatie door de ontwikkeling van post-transcriptionele modificaties in de eerste base van anticodons. In [7] wordt een beschrijving voorgesteld van de post-transcriptionele modificaties die de genetische code van LUCA karakteriseren. Wat de bestaande codes betreft, wordt in [5] een biochemische verklaring van de wobble-hypothese gegeven door de stabiliteit van de tweede letter van het anticodon in het ribosoomcentrum te bestuderen. Merk op dat in zowel [5] als [7] de regelmaat van de genetische code die bekend staat als de transformatie van Rumer een belangrijk aspect vertegenwoordigt. Het is een globale symmetrie van de genetische code die in de jaren zestig door de theoretisch fysicus Y. Rumer werd ontdekt [29]. 1 Met name de symmetrie van Rumer kan precies worden beschreven als een dichotomische klasse in termen van de chemische kenmerken van de eerste twee nucleotiden van een codon [31-33].

In onze benadering breiden we het fundamentele verband tussen symmetrie en degeneratie terug naar de oude evolutionaire periode van de genetische code. Hiertoe ontwikkelen we een model van de vermeende voorouder van de genetische code van LUCA. In de literatuur is er enige overeenstemming over het feit dat de degeneratiedistributie van deze voorouderlijke genetische code zou moeten samenvallen met die van de huidige mitochondriale genetische code van gewervelde dieren [7,34]. Naar onze mening moet een bevredigend model van de vroege code beschikken over: (i) de exacte kwantitatieve beschrijving van de degeneratieverdeling en (ii) de fundamentele Rumer's symmetrie die wordt geërfd door de LUCA's en daaropvolgende codes. We bouwen een model dat aan deze twee criteria voldoet, gebaseerd op stereochemische symmetrieën van oude chemische moleculen en hun informatieve tegenhanger als sequenties van nucleotiden.

In het eerste deel van het werk beschrijven we het model in detail. Verrassend genoeg kan alleen aan het eerste hierboven genoemde criterium worden voldaan als we een speciale set van 64 codons met vier basen beschouwen, dwz tesserae (van het Griekse tessera = vier), en een set oude symmetrische adapters [35] met anticodons van hetzelfde lengte. De door het model geboden oplossing is uniek en de beschrijving van de degeneratie van de vroege code impliceert het gebruik van codons van lengte vier. Dit kwalificeert de tessera-code als een vermeende voorouder van de vroege genetische code, d.w.z. een pre-vroege genetische code. Dit komt overeen met de hypothese dat de code is ontstaan ​​met codons langer dan drie nucleotiden [36]. We wijden het tweede deel van het werk aan het analyseren van de aannemelijkheid van de evolutionaire overgangen die door het model worden geïmpliceerd.

2. Symmetrie en degeneratie

Om het verband tussen degeneratie en symmetrie te laten zien, overweeg hypothetische omkeerbare tRNA-adapters die een Watson-Crick-achtige paarregel volgen (geen wiebelpositie) zie figuur 1. Merk op dat we alleen vereisen dat herkenning van tesserae-antitesserae wordt uitgevoerd door complementaire paring . In dit opzicht is het niet essentieel dat de chemische binding strikt Watson-Crick is. In de huidige vormen van mRNA en tRNA laten Watson-Crick-paren inderdaad niet toe om codons in de omgekeerde richting te herkennen. In pre-LUCA-tijden hadden analoge oude moleculen echter een bidirectionele herkenning mogelijk gemaakt. Er is bijvoorbeeld voorgesteld dat het eerste genetische materiaal een eenvoudigere ruggengraat gebruikte dan ribose [37]. Voor dergelijke moleculen is de richting van de paringstreng waarschijnlijk niet zo beperkend als bij daadwerkelijke DNA/RNA-moleculen. In [38] is gesuggereerd dat nucleïnezuren waarin R-ribose is vervangen door L-ribose, kunnen hybridiseren met natuurlijk DNA en RNA en een parallelstrengige A-vorm kunnen aannemen. In bestaande organismen kunnen specifieke nucleotidesequenties een parallelle oriëntatie aannemen die niet-canonieke basenparing omvat. Vooral parallel georiënteerde gebieden zijn gevonden in bacteriële (Escherichia coli, Listeria innocua) en insectengenomen (Drosophila melanogaster) van dergelijke ongebruikelijke structuren wordt verondersteld dat ze een opmerkelijke evolutionaire rol spelen en een significante impact hebben op biologische processen [39].

Figuur 1. Schematische weergave van de decodering via oer-omkeerbare tRNA-adapters die codons in beide richtingen kunnen lezen. Een tRNA met anticodon AUA (links) kan alleen worden gekoppeld aan het codon UAU, terwijl een tRNA met anticodon AUC (rechts) kan worden gekoppeld aan de codons GAU en UAG. Vandaar dat het aminozuur aa 1 gedragen door het eerste tRNA zal degeneratie 1 hebben en dat gedragen door het tweede tRNA ( aa 2) heeft degeneratie 2. (Online versie in kleur.)

Een ander feit dat de hypothese van 'omgekeerde herkenning' ondersteunt, is dat een codon en zijn omgekeerde codon altijd coderen voor vergelijkbare aminozuren [40], en in [6] is dit voorgesteld als een soort overblijfsel van een dergelijk proces. Een andere interessante mogelijkheid, naar voren gebracht in [6], is dat oude adapters, zoals pre-tRNA's, de D- en T-lussen misten en daarom, omdat ze bijna symmetrisch waren, ze in beide richtingen hadden kunnen binden. De omkerende symmetrie van oude adapters houdt in dat ze codons zowel in de 5'-3'- als in de 3'-5'-richting kunnen herkennen. Een dergelijke mogelijkheid is in een andere context onderzocht om de oorsprong van de genetische code te verklaren met omkeerbare oeradapters die slechts twee van de drie basen van het codon lezen en een soort van wiebelparing bevatten [6,28]. Opmerkelijk is dat reversibiliteit van de adapters van nature een vorm van degeneratie in codonherkenning induceert. Een tRNA met anticodon AUA kan bijvoorbeeld alleen worden gekoppeld aan het codon UAU. In plaats daarvan kan een tRNA met anticodon AUC worden gecombineerd met codons GAU en UAG. Daarom zal het aminozuur dat wordt gedragen door het eerste tRNA degeneratie 1 hebben, terwijl dat gedragen door het tweede tRNA degeneratie 2 zal hebben (figuur 1). In het algemeen coderen tRNA's met palindroom anticodon (d.w.z. invariant met betrekking tot inversie) aminozuren van degeneratie 1, terwijl niet-palindroom anticodon coderen voor aminozuren van degeneratie 2. Het contra-intuïtief is dat hoe symmetrischer een anticodon, hoe minder het bijbehorende aminozuur degenereert.

Op basis van de hierboven beschreven argumenten laten we zien hoe we een model kunnen bouwen van de degeneratie van de vroege code. Allereerst is het eenvoudig om aan te tonen dat als de codons lengte drie hebben, het probleem geen oplossing heeft. In feite zouden we 16 symmetrische (palindroom) codons verkrijgen die geassocieerd zijn met 16 aminozuren met degeneratie 1 en 48 codons zonder symmetrie, geassocieerd met 24 aminozuren met degeneratie 2. Het is duidelijk dat deze degeneratiewaarden (ofwel 1 of 2) niet overeenkomen. de degeneratiewaarden van de vroege code (dwz 2 of 4). De degeneratiewaarden kunnen worden vergroot door meer symmetrieën te overwegen. De belangrijkste symmetrieën die van nature geassocieerd zijn met DNA- of RNA-moleculen zijn de omgekeerde, complementaire en omgekeerde complementaire (plus de triviale identiteit). 2 Deze symmetrieën verschijnen in reële sequenties, bijvoorbeeld door inversies en omgekeerde transposities, en kunnen verantwoordelijk zijn voor de genomische balans die bekend staat als de tweede Chargaff-regel [41]. 3 Als we nu adapters beschouwen die zowel de omgekeerde als de omgekeerde complementaire symmetrie hebben, dan krijgen we de volgende degeneratieverdeling: 16 codons geassocieerd met acht aminozuren met degeneratie 2 en 48 codons geassocieerd met 12 aminozuren met degeneratie 4. Dit komt overeen met de degeneratiewaarden van de vroege code (dwz 2 en 4), maar de degeneratieverdeling is anders: 32 codons geassocieerd met 16 aminozuren met degeneratie 2, en 32 codons geassocieerd met acht aminozuren met degeneratie 4. Merk op dat we acht aminozuren hebben. zuren met degeneratie 2, terwijl de vroege code 16 aminozuren heeft met degeneratie 2. Dit betekent dat het model 32 symmetrische codons nodig heeft (niet alleen 16) en er is maar één manier om het doel te bereiken, namelijk codons overwegen met meer dan drie nucleotiden.

De exacte, unieke oplossing voor dit probleem wordt geleverd door de tessera-code (tabel 1), een speciale set van 64 codons met vier basen die worden herkend door een set oude adapters die zowel de palindroom als de omgekeerde-complementaire symmetrie bezitten (figuur 2 ). We bouwen de tessera-set van 64 codons met een lengte van vier door gebruik te maken van symmetrie-eigenschappen die verband houden met groepentheorie. )) Sterk/Zwak of complementair (SW: (A,U,C,G) → (U,A,G,C)), Pyrimidine/Purine (YR: (A,U,C,G) → (G, C,U,A)) en Keto/Amino (KM: (A,U,C,G) → (C,G,A,U)). Deze reeks transformaties F = (samen met de compositie-operator) isomorf met de Klein 4-groep van symmetrie (zie elektronisch aanvullend materiaal, A). We gaan uit van de vier enkele nucleotiden: we passen de vier transformaties toe en voegen de resulterende nucleotiden toe aan de oorspronkelijke. Bijvoorbeeld, beginnend bij A en solliciteren F = men verkrijgt . Deze eerste stap produceert de 16 mogelijke dinucleotiden. Nu passen we de vier mogelijke transformaties opnieuw toe op de 16 dinucleotiden en voegen ze toe aan de originele. Bijvoorbeeld, beginnend bij AU en solliciteren F = , men verkrijgt . Deze tweede stap produceert de tessera-set van 64 lengte-4-objecten. Wiskundig gezien is een tessera een quadruplet B1B2B3B4 waar Blen B3B4 = F(B1B2) waar FF. In tabel 1 presenteren we de tessera-set. Het is verdeeld in 16 kwartetten die overeenkomen met de transformaties die ze produceren (gerapporteerd aan de linkerkant van elk kwartet). Merk op dat 16 tesserae palindroom zijn (eerste kolom), 16 zelfcomplementair zijn (tweede kolom) en 32 geen van deze symmetrieën hebben.

Tabel 1. Volledige tabel van tesserae (vier-base codons met symmetrie-eigenschappen). Elk van de 16 kwartetten bevat vier tesserae en de transformatie die ze genereert, werkt op het eerste doublet om het tweede doublet te verkrijgen. Binnenkwartetten, tesserae met dezelfde kleurcode voor hetzelfde aminozuur: roze en groen = 2 + 2 en wit = 4.

Figuur 2. Schematische weergave van de tessera-decodering door oeradapters die twee palindroom en zelf-complementaire anticodons bezitten. We laten een enkele adapter zien die de anticodons AUUA en UAAU draagt ​​in de vier mogelijke koppelingsconfiguraties. Omdat de anticodons palindroom zijn, kunnen er slechts twee verschillende tesserae worden gelezen, zodat het verwante aminozuur degeneratie 2 zal hebben. (Online versie in kleur.)

Door de verzameling tesserae te lezen via de oer-tRNA-adapters die hierboven zijn gedefinieerd, kunnen we de degeneratieverdeling van de vroege genetische code volledig verklaren. In analogie met het voorbeeld weergegeven in figuur 1, hangt de degeneratie geassocieerd met de tessera-decodering af van de symmetrie ervan, namelijk, hoe symmetrischer een (anti)tessera, hoe minder gedegenereerd het bijbehorende aminozuur. Antitesserae worden analoog aan anti-codons gedefinieerd, d.w.z. het omgekeerde complement van een tessera.tRNA's met palindromische antitesserae kunnen palindromische tesserae in paren lezen, wat betekent dat het bijbehorende aminozuur degeneratie 2 heeft. Dit wordt getoond in figuur 2 waar de adapter, ongeacht de toegepaste symmetrie, alleen het paar tesserae AUUA, UAAU kan lezen. Aangezien er 16 palindroom tesserae zijn, produceert deze decoderingsstrategie acht aminozuren van degeneratie 2. Hetzelfde argument geldt voor de 16 zelf-complementaire tesserae en dit produceert acht extra aminozuren met degeneratie 2. Nu, een tRNA met een niet-symmetrische antitessera kan vier verschillende niet-symmetrische tesserae lezen (derde en vierde kolom van tabel 1). Dit houdt op zijn beurt in dat de acht aminozuren die aan deze tRNA's zijn gehecht, degeneratie 4 hebben. Figuur 3 toont dit geval waarbij een niet-symmetrische antitessera gepaard gaat met vier verschillende (niet-symmetrische) tesserae. In totaal krijgen we 16 aminozuren met degeneratie 2 en 8 aminozuren met degeneratie 4. Dit is in feite de feitelijke degeneratieverdeling van de vermeende vroege code, en valt samen met die van de huidige mitochondriale code van gewervelde dieren (waarbij degeneratie-6 aminozuur zuren dragen bij in elk kwartet met twee groepen codons, één groep met degeneratie 2 en de andere met degeneratie 4). In tabel 2 rapporteren we het aantal codons, het aantal symmetrische codons en de verschillende degeneratieverdelingen als functie van de codonlengte. Merk op dat de 4T-oplossing (tesserae van lengte 4) het enige geval is dat de degeneratie van de mitochondriale genetische code van gewervelden geeft.

Figuur 3. Schematische weergave van de tessera-decodering via oeradapters die twee niet-symmetrische antitesserae bezitten. De vier mogelijke ruimtelijke configuraties van de adapter zijn gekoppeld aan vier verschillende tesserae en produceren een aminozuur met degeneratie 4. (Online versie in kleur.)

Tabel 2. Aantal codons, aantal symmetrische codons en degeneratieverdeling als functie van de codonlengte. Merk op dat de 4T-oplossing (tesserae van lengte 4) het enige geval is dat de degeneratie van de mitochondriale genetische code van gewervelden geeft.

Een sterke ondersteuning voor onze hypothese over de oorsprong van degeneratie wordt geleverd door een wiskundig model van de genetische code dat de degeneratie van zowel de nucleaire als de mitochondriale varianten verklaart. Het model, beschreven in [33,42], is gebaseerd op getaltheorie, d.w.z. redundante representatiesystemen voor gehele getallen (zie kader 1). Gebruikelijke nummeringssystemen zijn gebaseerd op de additieve ontleding van een getal met behulp van de machten van een grondtal B. In dit geval heeft elk nummer een unieke weergave. Integendeel, nummeringssystemen zonder macht gebruiken een reeks die langzamer groeit dan de bevoegdheden van een basis. In het laatste geval kan een getal een niet-unieke (ontaarde) representatie hebben en dit kan worden gebruikt om de degeneratieverdeling van de genetische code te beschrijven. De analyse van de euplotid nucleaire genetische code leidt tot de unieke oplossing: 8, 7, 4, 2, 1, 1 zie box 1 en [42]. Dezelfde analyse voor de mitochondriale genetische code van gewervelde dieren leidt tot de unieke oplossing: 8, 8, 4, 2, 1, 0 zie kader 1. Dit laatste resultaat impliceert met name de verdeling van de code in twee equivalente sets. Elke set kan worden geïnterpreteerd in termen van dinucleotiden en de volledige weergave als samengevoegde paren van dinucleotiden. Op deze manier ontstaan, precies zoals in onze biologische hypothese, codons van vier nucleotiden van nature. Zie [33,35] voor een gedetailleerde beschrijving van het ontstaan ​​van de tessera-set en zijn verbanden met het niet-machtsmodel van de genetische code.

Kader 1. Synopsis van niet-machtsnummeringssystemen en hun toepassing op het modelleren van de nucleaire euplotide en gewervelde mitochondriale genetische codes.

3. Evolutionaire implicaties

Voor zover ons bekend vertegenwoordigt de tessera-code een eerste kwantitatieve verklaring voor de oorsprong van degeneratie in voorouderlijke codes. Als zodanig kan het relevant zijn om de evolutie van de genetische code te verklaren. In het tweede deel van dit artikel analyseren we de mogelijke evolutionaire implicaties van de tessera-code. Voor dit doel herinneren we ons de evolutiehypothese van Watanabe & Yokobori [34] die gebaseerd is op de analyse van translatie in bestaande mitochondriën (zie figuur 4 aangepast van [34]). Figuur 4 presenteert mijlpalen waarover enige overeenstemming bestaat en die de evolutionaire stappen vertegenwoordigen van een primitieve genetische code naar de huidige varianten. Vertrekkend van bestaande varianten en teruggaand in de tijd vinden we de eerste mijlpaal, namelijk de universele genetische code van LUCA. Er wordt verondersteld dat deze code een structuur heeft die vergelijkbaar is met die van de huidige nucleaire standaard genetische code. De eenvoudigste variant van bestaande codes is de mitochondriale genetische code van gewervelde dieren die, voornamelijk om deze reden, is voorgesteld als een model van de voorloper van de universele LUCA-code: de vroege code (de tweede mijlpaal van rechts in figuur 4). De belangrijkste evolutionaire nieuwigheid die wordt geïmpliceerd door de overgang van de vroege naar de universele code, is het verschijnen van post-transcriptionele modificaties in tRNA's. Dit wordt ondersteund door het feit dat, in sommige bestaande Metazoan mitochondria, een ongemodificeerde U op de eerste positie van het anticodon kan paren met alle basen op de derde positie van het codon [43]. Dit maakt het mogelijk families van codons te decoderen zonder de noodzaak van gemodificeerde nucleotiden (een familie is een groep van vier codons die de eerste twee basen delen en coderen voor hetzelfde aminozuur). In het voorstel van Watanabe & Yokobori [34] is de vroege code afgeleid van een primitieve code met minder, meer gedegenereerde aminozuren, d.w.z. de code van Jukes [44]. Een dergelijke code wordt verondersteld alleen te worden gevormd door families, met uitzondering van één aminozuur en het stopsignaal die twee degeneratie hebben, d.w.z. worden gecodeerd door twee codons.

Figuur 4. Weergave van de evolutie van de genetische code, aangepast van [34]. Elke cirkel of vierkant vertegenwoordigt een mijlpaal. De onderste regel toont de evolutie van de codonlengte die door onze theorie wordt geïmpliceerd.

Onze belangrijkste bewering is dat de tessera-code een voorouder van de vroege code vertegenwoordigt, namelijk een pre-vroege code, geplaatst tussen de primitieve en de vroege code. Er zijn verschillende argumenten die de tessera-code als pre-early-code ondersteunen (de vierkante mijlpaal in figuur 4). Eerst en vooral heeft het precies dezelfde degeneratiestructuur als de vroege genetische code. Bovendien is de tessera-code in overeenstemming met de hypothese van Baranov et al. [36], waarbij een oorsprong van de code wordt voorgesteld met lange oligonucleotiden, gevolgd door een vermindering van de codonlengte totdat het optimale aantal van 3 is bereikt. Ervan uitgaande dat de pre-vroege code codons van lengte 4 heeft, impliceert dat ook de primitieve code codons van ten minste 4 heeft. We laten inderdaad zien dat Jukes' primitieve genetische code kan worden geïmplementeerd met generieke codons van lengte 4. In de volgende beschrijving gebruiken we de term codon om codons met lengte vier of tetracodons aan te duiden. De code van Jukes heeft 15 aminozuren met degeneratie 4, één aminozuur met degeneratie 2 en twee stopcodons. In totaal zijn er 15 elementen met degeneratie 4 en 2 elementen met degeneratie 2. Als we aannemen dat deze code afkomstig is van codons van 4 nucleotiden, dan impliceert dit de keuze van 17 elementen/aminozuren die kunnen worden gecodeerd door twee of vier codons genomen uit de set van 4 4 = 256 codons. Merk op dat de set van 256 codons kan worden opgedeeld in een subset van 32 codons die enige symmetrie bezitten (deze komen overeen met de eerste twee kolommen van de tessera-code van tabel 1) en een subset van 224 codons zonder symmetrie. Zoals hierboven getoond, komen symmetrische codons overeen met aminozuren met degeneratie 2, terwijl asymmetrische codons overeenkomen met aminozuren met degeneratie 4. Als we nu uitgaan van een willekeurig mechanisme voor de toewijzing van codons aan aminozuren, komt de degeneratieverdeling met de grootste waarschijnlijkheid overeen precies aan die van Jukes' code. We hebben dit aangetoond in het elektronische aanvullende materiaal B. Jukes gaat ervan uit dat een van de elementen van degeneratie 2 geassocieerd is met het stopsignaal. Met deze keuze worden stopcodons minder snel gegenereerd door willekeurige fouten, dwz deze elementen zijn minder dubbelzinnig dan die met degeneratie 4. Evenzo is het natuurlijk om te veronderstellen dat het andere element met degeneratie 2 overeenkomt met het aminozuur dat codeert voor het startsignaal.

We hebben laten zien dat de primitieve code (Jukes-versie) natuurlijk wordt beschreven met codons van lengte 4. Nu beschrijven we een mogelijk evolutionair pad van Jukes-code naar de tessera-code. In onze benadering bestaat de primitieve code uit twee paren symmetrische codons en 60 niet-symmetrische codons. Merk op dat de selectie van symmetrische codons, vanwege hun verminderde neiging tot puntmutatiefouten, een eerste stap vertegenwoordigt voor het selecteren van de symmetrische helft van de tessera-set. Stel dat een nieuwe adapter met een symmetrisch anticodon verschijnt en concurreert (draagt ​​hetzelfde aminozuur) met een bestaande adapter met een asymmetrisch anticodon. De nieuwe adapter kan binden aan symmetrische codons die deel uitmaken van de tessera-set (eerste twee kolommen van tabel 1). Een dergelijke adapter heeft een evolutionair voordeel ten opzichte van degene die een niet-symmetrisch anticodon draagt, omdat het twee verschillende ruimtelijke configuraties heeft die kunnen worden gebruikt voor binding met het codon. De adapter in figuur 2 draagt ​​bijvoorbeeld het palindroom anticodon AUUA. Als de adapter wordt omgekeerd, kan deze nog steeds binden aan het codon/tessera UAAU. Deze selectiedruk veroorzaakt het vangen van alle symmetrische codons (tetracodons)/tesserae ten koste van niet-symmetrische codons. Aan het einde van dit proces hebben we een code die bestaat uit 32 symmetrische tesserae en 32 niet-symmetrische tetracodons die niet noodzakelijk tot de tessera-set behoren. Op dit punt wordt een verdere optimalisatiestap bereikt door niet-symmetrische tesserae te selecteren: zoals getoond in [35], zijn tesserae immuun voor puntmutaties 4 en overleven ze dus tot niet-tessera-tetracodons vanwege de evolutionaire druk van decoderingsnauwkeurigheid. De 32 symmetrische tesserae zijn immuun voor puntmutaties (twee gelijktijdige, hoogst onwaarschijnlijke, puntmutaties zijn nodig om een ​​overgang tussen twee tesserae te bewerkstelligen). Dit betekent dat de overeenkomstige tRNA's niet leiden tot de opname van een niet-verwant aminozuur als ze worden onderworpen aan een puntmutatie. Deze eigenschap van foutdetectie impliceert een evolutionair voordeel in termen van nauwkeurigheid van eiwitsynthese. De overige 32 niet-symmetrische tetracodons zijn niet noodzakelijk tesserae, maar degenen die tesserae zijn, hebben de eigenschap van foutimmuniteit, zodat ze geleidelijk zullen worden geselecteerd om de bovengenoemde redenen. Daarom verkrijgen we de volledige structuur van de tessera pre-vroege code waarvan de degeneratieverdeling samenvalt met die van de vroege code (en met die van de bestaande mitochondriale code van gewervelde dieren).

We hebben aangetoond dat de overgang tussen de code van Jukes en de tessera-code het meest waarschijnlijk is onder minimale aannames. Het is duidelijk dat in deze overgang de tessera-herkenning specifieker wordt dan de tetracodon-herkenning van de Jukes-code. De eigenschap van foutdetectie van de tessera-code maakt het inderdaad mogelijk om de ambiguïteit met betrekking tot de aminozuurlading van tetracodon-adapters te verminderen. Op zijn beurt maakt de verhoogde precisie in de tessera-herkenning het mogelijk om de keuze van aminozuren te verfijnen vanwege de evolutionaire druk van eiwitprestaties.

Onze hypothese van de tessera-code als een pre-vroege code impliceert ook een andere belangrijke evolutionaire overgang, namelijk de overgang tussen de tessera-code en de vroege code. Aangezien verondersteld wordt dat de vroege code codons van lengte drie heeft, houdt het grootste probleem van deze overgang verband met de verandering in de lengte van het codon, die over het algemeen als schadelijk wordt beschouwd [16]. Merk op dat (i) elke theorie over de oorsprong van de code met een codonlengte die verschilt van drie met dit probleem moet worden geconfronteerd [36] en (ii) een dergelijke overgang schadelijk is wanneer een evolutionair niveau wordt bereikt waarin de code is bevroren, aangezien dit een dramatische verandering in de volgorde van aminozuren van alle eiwitten van een organisme, dit is echter niet noodzakelijk het geval in eerdere evolutionaire stappen dichter bij de oorsprong van de code. De tessera-code maakt het mogelijk om een ​​nette oplossing te vinden voor het probleem van de overgang van tetracodons naar codons. In feite is de informatie die door de tessera-set wordt gedragen, overbodig. Per definitie, als er drie van de vier letters van een tessera bekend zijn, kan de ontbrekende letter eenduidig ​​worden afgeleid. Vandaar dat, vanuit het oogpunt van coderingstheorie, de tessera-code en elke trinucleotide-genetische code dezelfde informatieve inhoud hebben. Dit houdt in dat een één-op-één mapping tussen tesserae en codons kan worden vastgesteld. De essentiële structuur van een dergelijke mapping houdt in dat de transformaties tussen aangrenzende letters van een tessera de nucleotiden van een codon worden. In het bijzonder, gegeven een tessera B1B2B3B4 we kunnen drie chemische transformaties hebben tussen aangrenzende letters: t12 = F(B1B2) tussen B1 en B2, t23 = F(B2B3) tussen B2 en B3, en t34 = F(B3B4) tussen B3 en B4. Merk op dat slechts twee van deze drie transformaties onafhankelijk zijn sinds t34 = t12. In tabel 4een, we hebben de tessera-code opnieuw gerangschikt volgens de transformatie t12 (rijen) en t23 (kolommen). We stellen voor dat t12 en t23 worden toegewezen aan respectievelijk het eerste en tweede nucleotide van het codon (x1, x2). Deze correspondentie is weergegeven in tabel 3. Bovendien is de vierde letter B4 wordt in kaart gebracht op het derde nucleotide van het codon x3. Een schematische weergave van de afbeelding wordt weergegeven in figuur 5. Merk op dat, volgens deze afbeelding, de kolommen van de tessera-set worden afgebeeld op de kolommen van de genetische code, zodat t23 = I wordt toegewezen aan NAN-codons (degeneratie niet-4), en t23 = KM wordt in kaart gebracht op NCN-codons (alleen samengesteld uit families) vergelijk tabel 4B met tafel 4C. We kunnen zien dat deze twee kolommen van de tessera-code dezelfde degeneratie delen met de overeenkomstige kolommen van de genetische code (ofwel 4 of 2 + 2). De natuurlijke voltooiing van de mapping toewijzingen t23 = SW naar NUN-codons en t23 = YR naar NGN-codons. De laatste twee toewijzingen moeten rekening houden met enkele uitzonderingen die worden bepaald door het feit dat in de overgang van tesserae naar codons de symmetrie van Rumer weliswaar behouden blijft, maar de zelf-complementaire symmetrie niet. De tessera-antitessera-interactie is specifieker dan de codon-anticodon-interactie, vanwege de aanwezigheid van vier Watson-Crick-achtige chemische bindingen. In het geval van bestaande genetische code wordt de degeneratie echter voornamelijk bepaald door de codon-anticodon-interactie van de eerste twee basen. Door aan te nemen dat de bindingsenergie in pre-vroege codetijden vergelijkbaar is met die van Watson-Crick, zou de tessera-antitessera-interactie-energie ongeveer het dubbele moeten zijn van de werkelijke codon-anticodon-energie.

Figuur 5. Schematische weergave van de mapping tussen de tessera (B1B2B3B4) op het codon (x1x2x3).

Tabel 3. Basisstructuur van de mapping tussen tesserae en codons. De vier transformaties tussen de basen van een tessera worden afgebeeld op de vier nucleotiden van een codon.

Tabel 4. (een) De tessera-code georganiseerd volgens de transformaties: eerste-tweede letter t12 (rijen) en tweede-derde letter t23 (kolommen) (B) hetzelfde als (een) maar met de verwisselde kwartetten zoals aangegeven door de pijlen. (C) Degeneratie van de mitochondriale genetische code van gewervelden. De codons van de mitochondriale code van gewervelden in (C) en de tesserae (B) zijn gerelateerd via de één-op-één-toewijzing die in de tekst wordt beschreven. Binnenkwartetten, tesserae met dezelfde kleurcode voor hetzelfde aminozuur: roze en groen = 2 + 2 en wit = 4.

Dus, vanuit biochemisch oogpunt, impliceert de overgang van tesserae naar codons de overgang tussen een volledige vier-base lange specifieke Watson-Crick-achtige koppeling voor het lezen van tesserae naar de wiebelstrategie voor het lezen van codons.

Dit impliceert in het bijzonder theoretische beperkingen op sommige symmetrie-eigenschappen die aanwezig zijn in de wereld van tesserae maar niet in bestaande codes, bijvoorbeeld het verlies van de zelf-complementaire symmetrie. Elke kolom van de tessera-code heeft inderdaad een bepaalde degeneratie, maar in bestaande codes geldt dit alleen voor twee kolommen, d.w.z. codons van het type NMN (NAN of NCN). In plaats daarvan hebben de kolommen die overeenkomen met codons NKN (NUN of NGN) met name gemengde degeneratie, de verschillende kwadranten tussen de twee codes zijn die van de soort SUN en WGN (we noemen WSN of SWN gemengd in tegenstelling tot de niet-gemengde SSN WWN ). Met andere woorden, bestaande codes hebben codons van de soort WGN die aminozuren coderen met degeneratie 2 ondanks het feit dat de centrale base sterk is, en codons van de soort SUN die aminozuren coderen met degeneratie 4, ondanks het feit dat de centrale base is zwak [53].

Een verklaring van dergelijke kenmerken in termen van energetische beperkingen, afhankelijk van de stereochemie van de codon-anticodon-interactie, wordt voorgesteld in [5]. In de bestaande genetische code wordt een zwakke interactie normaal geassocieerd met een 2 + 2 degeneratie. Dit is inderdaad het geval voor codons van het type NAN, AUN en UUN. Bij een U als tweede letter echter een verdere stabilisatie van de purine centrale letter N35 in de anticodon-lus van het tRNA door U33 maakt het mogelijk om een ​​compleet gezin te lezen ondanks het zwakke karakter van N35. 5 In de spiegelkast, voor codons van het type AGN en UGN het nucleotide N35 wordt niet voldoende gestabiliseerd door U33 en het bijbehorende kwartet wordt van degeneratie 2 + 2.

Deze wobbelstrategiebeperkingen impliceren dat bij het in kaart brengen van tesserae naar codons het kwadrant (YR-SW) wordt verwisseld met kwadrant (SW-YR) en kwadrant (KM-SW) met kwadrant (I-YR) zie tabel 4 (bovenste panelen) . Uiteindelijk wordt de vierde letter van een tessera afgebeeld op de derde letter van een codon met de volgende uitzondering die zorgt voor een correcte groepering: als B4 = K (T of G) dan x3 = km(B4), d.w.z. T en G worden anders verwisseld x3 = B4. Merk op dat de afbeelding niet noodzakelijk uniek is, maar voor zover wij weten, toont de huidige aan dat het mogelijk is om van de tessera-code naar de bestaande code over te gaan door alle bekende degeneratiekenmerken van de laatste te beschrijven.

Als de eiwitcodering oorspronkelijk codons omvatte die langer waren dan drie basen, dan zou de vertaalmachinerie hier enige herinnering aan moeten hebben. Inderdaad, de kleine subeenheid van bestaande ribosomen biedt een structurele vrijheid die de opname van een extra nucleotide in het decoderingscentrum mogelijk zou maken, zodat het decoderen van codons met vier basen mogelijk is. Merk op dat de mogelijkheid van voorouderlijke codering met vierlingen was genoemd in [16]. Quadrulet-decodering werd inderdaad ontdekt in 1973 [45] als een mechanisme dat verband houdt met de onderdrukking van frameshift en wordt tegenwoordig veel gebruikt in biotechnologische toepassingen om niet-canonieke aminozuren in eiwitten op te nemen [46-48]. Bovendien is de biologische haalbaarheid van codons met een lengte van vier en van een orthogonaal ribosoom dat ze decodeert in het laboratorium aangetoond [46].Er is ook bewijs dat wijst op het bestaan ​​van overlappende genen gecodeerd door tetracodons [49] bovendien is aangetoond dat tetracodons een belangrijke rol spelen in fylogenetische analyse (bijv. [50]) en dit kan een indicatie zijn van een genetische geheugen.

Een indrukwekkend aantal eigenschappen van de tessera-code is bewaard gebleven in de huidige codes. De vroege code en al zijn nakomelingen erven van de tessera-code het aantal codons (64 tesserae genereren 64 codons) en het maximale aantal aminozuren (23). De tessera-code maakt het mogelijk om te coderen voor 24 elementen/aminozuren. Aangezien ten minste één van deze een stopsignaal moet vertegenwoordigen, is het maximale theoretische aantal representeerbare aminozuren 23. Opmerkelijk is dat geen enkele bestaande code deze limiet overschrijdt en het maximale aantal aminozuren dat direct door sommige genomen wordt gecodeerd, is precies 23: de 20 standaard aminozuren plus 2 niet-standaard aminozuren (selenocysteïne en pyrrolysine) en het alternatieve initiatie-aminozuur N-formylmethionine som op tot 23. Bovendien is het aantal adapters dat wordt gebruikt in de mitochondriale genetische code van gewervelden 22: acht tRNA's die elk vier codons herkennen, 14 tRNA's die elk twee codons herkennen en twee paren codons die niet zijn geassocieerd met aminozuren [ 34,51. Opmerkelijk is dat 22 het absolute minimum is dat wordt waargenomen bij alle bekende versies van de genetische code. Dit is ook precies de structuur die wordt geïmpliceerd door het tessera-model: acht oeradapters van degeneratie 4, plus 16 adapters van degeneratie 2 vormen een set van 24 adapters als we twee adapters van degeneratie 2 weggooien die zijn toegewezen aan stopcodons, we krijgen precies 22.

De mitochondriale genetische code van gewervelde dieren en ons op tessera gebaseerde model van de vroege code delen ook een aantal kenmerken die verband houden met symmetrie (bijv. tabel 5). Eerst en vooral verandert de KM-transformatie, ook bekend als Rumer's transformatie, toegepast op het eerste doublet van een codon, de degeneratie van het overeenkomstige aminozuur. Deze universele eigenschap wordt waargenomen in de meeste bekende versies van de genetische code (zowel nucleair als mitochondriaal). De tessera-code bezit deze eigenschap ook. De tessera AUUA komt bijvoorbeeld overeen met een aminozuur van degeneratie 2, en als we de KM-transformatie toepassen op de eerste twee nucleotiden, krijgen we de tessera CGUA die overeenkomt met een aminozuur van degeneratie 4. Merk op dat deze eigenschap ook geldt als we Pas Rumer's transformatie toe op de t12t23 van de afbeelding die de hierboven beschreven tesserae en codons verbindt. Voor meer inzichten, zie [53].

Tabel 5. Vergelijkende tabel tussen de mitochondriale genetische code van gewervelde dieren en de tessera-code.

Een ander fundamenteel aspect van de tessera-code is dat de codering van een eiwit robuust kan worden gemaakt tegen +1 frameverschuivingen. De robuustheid van het frameonderhoud kan ook verband houden met circulaire codes waarvan verondersteld wordt dat ze een rol spelen in de processen van framesynchronisatie [54-58]. Het bestaan ​​van een universele circulaire code-eigenschap is gerelateerd aan de oorsprong van de genetische code als paren van complementaire codons die coderen voor hetzelfde of een vergelijkbaar aminozuur [59]. Hetzelfde vermoeden wordt ondersteund in andere contexten [24]. Deze eigenschap komt van nature voor in de tessera-code waar een tessera en zijn omgekeerde complement altijd coderen voor hetzelfde aminozuur.

4. Conclusie

De oorsprong van degeneratie in eiwitcodering is beschreven met minimale aannames, inderdaad alleen die met betrekking tot symmetrie-eigenschappen van het coderen en decoderen van oude moleculen en hun mogelijke stereochemische interacties. De theorie is consistent met vele pogingen om de oorsprong en evolutie van degeneratie te beschrijven, bijvoorbeeld die met betrekking tot stereochemische herkenning van lange oligonucleotidesequenties door ribozymen in een RNA-wereld (zie [36,60] en referenties daarin), die met betrekking tot verschillende symmetriebenaderingen [1–3,8–10,12–14], en in het bijzonder degenen die omgekeerde herkenning van codons claimen [6]. In onze benadering is de beschrijving van de degeneratie van de pre-vroege genetische code exact en ontstaat deze niet als resultaat van ad hoc parameterafstemming. Er zijn inderdaad geen vrije parameters in het model! Alleen symmetrie-eigenschappen zijn van belang: de fundamentele status van symmetrieprincipes in de natuurwetenschappen wordt binnen de moleculaire biologie en evolutie op hetzelfde niveau van betekenis gebracht. De theorie heeft veel interessante implicaties, bijvoorbeeld het verrassende resultaat dat de primitieve en vroege versies van de genetische code door een intermediaire code (de pre-vroege code) verbonden zijn met codons van lengte vier en met een degeneratieverdeling die samenvalt met die van de huidige mitochondriale genetische code van gewervelde dieren. De evolutionaire overgangen tussen dergelijke voorouderlijke codes worden aannemelijk verklaard door evolutionaire druk die verband houdt met decoderingsnauwkeurigheid. Bovendien impliceert dit scenario dat sommige voorouderlijke eigenschappen mogelijk bewaard zijn gebleven door evolutionaire tijdschalen. Dit is inderdaad het geval, zoals we hebben aangetoond, en het behoud ervan vormt een dwingende uitdaging met betrekking tot hun biologische betekenis. Een belangrijke vraag is bijvoorbeeld hoe foutcorrigerende eigenschappen, die in de tessera-code expliciet identificeerbaar zijn, zijn ‘vertaald’ in bestaande codes. Foutcontrole is een onvermijdelijke vereiste van elk eiwitsynthesesysteem. In bestaande genetische codes is de immuniteit tegen puntmutaties niet langer duidelijk. De kwestie hoe bestaande decodeersystemen foutencorrigerende capaciteiten behouden, ondanks het verlies van redundantie als gevolg van de vermindering van de codonlengte, vormt een interessante open vraag. Met name de vergelijking tussen het tessera-model en het wiskundige model van de genetische code ontwikkeld in [32,33,35,42,61,62] suggereert dat de rol van chemische transformaties in het tessera-model wordt weerspiegeld door de rol die wordt gespeeld door dichotomische klassen in bestaande genetische codes en we zullen de kwestie in toekomstig onderzoek behandelen.

De theorie die in dit werk wordt gepresenteerd, maakt deel uit van een uniform wiskundig raamwerk dat degeneratie beschrijft met representatiesystemen voor gehele getallen (zie kader 1 en [33,61–63]). Het raamwerk is een nieuw paradigma voor het interpreteren van genetische informatie en leidt tot de definitie van wiskundige objecten die een betekenisvolle biochemische interpretatie hebben. Dichotomische klassen zijn bijvoorbeeld van het model afgeleide binaire variabelen die gekoppeld zijn aan de chemische eigenschappen van de nucleotiden van een codon. De analyse van coderende DNA-sequenties door middel van dichotomische klassen benadrukte de aanwezigheid van universele sterke korte-afstandscorrelaties die gerelateerd kunnen worden aan foutdetectie [31,32]. Bovendien kan de theorie van circulaire codes [52,54,56,58], een klasse van foutdetectiecodes die zijn voorgesteld als strategieën voor framedetectie en onderhoud, ook worden gerelateerd aan dit wiskundige raamwerk [64].

Ons werk wijst op een oorsprong van de degeneratie gebaseerd op elementaire eigenschappen van scheikunde en natuurkunde, voornamelijk de symmetrieën van oermoleculen. Bovendien suggereren onze resultaten dat zowel de symmetrieën als de degeneratiedistributie van de mitochondriale code gedurende evolutionaire tijden bewaard zijn gebleven en verdere fundamentele vragen oproepen.


Biochemie

Het Department of Studies in Biochemistry werd opgericht in het jaar 1993-1994 met een M.Sc., programma aan het PG Center van Kuvempu University, Davangere. Later, met de oprichting van Davangere University op 18 augustus 2009 is de afdeling onder Davangere University gekomen. De afdeling heeft 26 jaar van haar bestaan ​​met succes afgerond. De afdeling biedt momenteel M.Sc., M.Phil en Ph.D. Programma's op belangrijke gebieden van de biochemie, zoals kankerbiologie, plantenbiochemie en natuurlijke producten, immunomodulatie en ontstekingsbiologie, biologische afbraak, biotransformatie en biokatalyse.

De afdeling heeft ongeveer 672 postdoctorale studenten biochemie voortgebracht, waarvan meer dan 98% geslaagd is in de eerste klas of hoger. Velen van hen hebben gediend als universitaire faculteitsleden, doen postdoctoraal onderzoek in gerenommeerde instituten en universiteiten in India en in het buitenland. Veel studenten van de afdeling hebben de CSIR-UGC/NET-, ICAR-JRF-, GATE- en K-SET-examens gehaald.

De faculteiten van de afdeling zijn actief op het gebied van onderwijs en onderzoek. Faculteitsleden van de afdeling hebben meer dan 150 artikelen gepubliceerd in internationale en nationale peer-reviewed tijdschriften. Grote onderzoeksprojecten zijn gesanctioneerd aan faculteitsleden van de afdeling door DBT, DST, DAE-BRNS, UGC, ICMR en VGST met subsidies ter waarde van Rs.4.5 crore. De afdeling heeft adequate onderzoeksfaciliteiten zoals Animal Cell Culture Laboratory, Plant Tissue Culture Laboratory en Microbiology Laboratory for Biotransformation. De afdeling is via MOU's ook samenwerkingsonderzoek aangegaan met Industries, pioniersinstituten in India en in het buitenland. De afdeling organiseert internationale/nationale seminars, workshops, symposia en webinars die vooraanstaande wetenschappers en professoren van verschillende universiteiten, instituten en industrieën in het hele land uitnodigen om de faculteit, onderzoekers en studenten in staat te stellen hun kennis bij te werken. Afdeling heeft Society of Biological Chemists (India), Branch sinds maart 2001.

Afdeling ontwikkelen tot een hightech onderzoeksgerichte afdeling met de nadruk op waardetoevoeging.

Toewijding aan onderwijs en onderzoek, en om onderwijs van wereldklasse te bieden met behulp van moderne laboratoriumfaciliteiten voor onze gewaardeerde studenten tegen een betaalbare vergoeding.

Huidige syllabus (2016-17): We volgen de huidige syllabus


Universaliteit en HGT

Eerdere argumenten over universaliteit berusten op het bestaan ​​van een universele gemeenschappelijke voorouder met een bevroren code. Een gedetailleerde deconstructie van dergelijke argumenten wordt gepresenteerd in: Ondersteunende tekst (die als ondersteunende informatie is gepubliceerd op de PNAS-website) en verder wordt ondersteund door de computersimulaties die worden gepresenteerd in Model van code-aantrekking vanwege HGT, maar de ondubbelzinnige conclusie is dat verticale afdaling op zichzelf onvoldoende is om de universaliteit van de genetische code te verklaren. Hier presenteren we een alternatief: de universaliteit van de genetische code is een generiek gevolg van de gemeenschappelijke evolutie van het vroege leven. HGT van eiwitcoderende regio's en HGT van translationele componenten zorgen voor de opkomst van clusters van vergelijkbare codes en compatibele translationele machines. Verschillende clusters strijden om niches, en vanwege de voordelen van de gemeenschappelijke evolutie is de enige stabiele oplossing van de clusterdynamiek universaliteit. Binnen clusters is een gecoördineerde optimalisatie van codes mogelijk. Deze mechanismen zijn consistent met twee macro-evolutionaire scenario's. (l) De code bleef te allen tijde bijna universeel. (ii) De codes liepen eerst uiteen, maar werden geleidelijk universeel.

Concurrentie tussen innovatiepools.

Een van de voordelen van gemeenschappelijke evolutie is dat universeel goede eigenschappen en verfijningen zich via HGT kunnen verspreiden naar organismen die verschillende niches bezetten, waardoor hun diversiteit behouden blijft. In een wereld die steeds meer wordt gedomineerd door eiwitten, zouden ze bij de meeste innovaties betrokken zijn, en dienovereenkomstig zal HGT het meest effectief zijn tussen organismen met dezelfde genetische code. Op deze manier sorteren de organismen in gemeenschappen die verwante genetische codes delen. Een enkele codegemeenschap kan cellen omvatten die zijn aangepast aan verschillende niches en met een verschillende organisatie.

Hoe groter de gemeenschap en diversiteit van organismen die voldoende verwante genetische codes delen, hoe groter de pool van eiwitinnovaties die voor iedereen toegankelijk is. Dit leidt tot een snellere evolutie tussen de grotere gemeenschappen dan de kleinere en daarom een ​​groter potentieel om niches binnen te vallen die worden ingenomen door organismen met verschillende onverenigbare genetische codes. Met deze dynamiek zullen grotere gemeenschappen de neiging hebben om nog groter te worden ten koste van kleinere. De enige stabiele oplossing is een universele genetische code. Het zijn dus geen betere genetische codes die een voordeel geven, maar meer algemene.

De elementaire stap in dit proces is het inhalen van een bezette niche door de afstammelingen van een organisme met een andere genetische code. Als twee groepen organismen met elkaar concurreren, zal degene die toegang heeft tot meer innovaties (degene die behoort tot de grotere gemeenschap van gemeenschappelijke/compatibele genetische codes) gemiddeld de andere overtreffen. In tegenstelling tot het geval met alleen verticale evolutie, is er een actieve feedbacklus, aangedreven door het delen van innovatie via HGT, die niet alleen de genetische code onderscheidt van alle andere eigenschappen van een cel, maar ook een mechanisme biedt dat concurrentie tussen codes stimuleert .

Dit mechanisme (hierna "concurrentie tussen innovatiepools" of CIP genoemd) gaat ervan uit dat de protocollen vastliggen. Maar hoe zijn de protocollen zelf ontstaan ​​en geëvolueerd? Hoe kan een protocol worden geüpgraded zonder het te vernietigen?

Code-aantrekking en -optimalisatie vanwege HGT van eiwitcoderingsregio's.

Een populatie van organismen die een niche bezetten, is onderhevig aan spontane codemutaties en wordt gebombardeerd door vreemd genetisch materiaal van organismen die verschillende niches bezetten. Horizontaal overgedragen genen kunnen nuttig zijn voor de ontvanger, zelfs als de donor een (enigszins) andere code heeft. Het codongebruik (bijvoorbeeld de frequentie van het gebruik van synoniemcodons) van een overgedragen gen is bijvoorbeeld aangepast aan de donorcode en verschilt daarom van die van de ontvanger. Dienovereenkomstig zal er indirecte druk zijn op de ontvangercode om zichzelf aan te passen om het nieuwe gen beter te gebruiken.

We verwachten dat de coderespons verschillende karakteristieke tijdschalen zou omvatten. Op de lange schaal is de richting van verandering het verminderen van ambiguïteit, maar op de korte schaal moet de code een grotere mate van ambiguïteit kunnen tolereren bij het opnemen van nieuwe genen. De middelen die de cel ter beschikking staan ​​om het niveau van translatie nauwkeurig af te stemmen, kunnen worden beschouwd als van twee essentiële oorsprong: die binnen de cel en die welke gemeenschappelijk zijn en de invloed van de omgeving en naburige cellen weerspiegelen. Mechanismen intern in de cel omvatten verandering in tRNA-expressieniveaus en ontstemming van de ribosomale machinerie zelf, zoals bekend is door variaties in Mg-ionconcentratie, antibiotica en structurele mutaties. Gemeenschappelijke mechanismen hebben waarschijnlijk betrekking op de invoer van tRNA uit andere organismen. De toename op de korte tijdschaal in translationele ambiguïteit wordt op dezelfde tijdschaal gecompenseerd door de gunstige effecten van het nieuwe gen. Uiteindelijk zal het codon- en aminozuurgebruik van het nieuw overgedragen segment in evenwicht komen met de rest van het genoom en zal de indirecte druk van de donorcode op de ontvangercode verdwijnen, terwijl de geaccumuleerde effecten achterblijven.

Meer in detail geven deze argumenten aan dat na een HGT-gebeurtenis de genetische code van de donor de genetische code van de acceptor beïnvloedt. Gegeven een buitenaards gen, ondergaat het gastheer-buitenaardse gensysteem een ​​cyclisch dynamisch proces dat leidt tot volledig gebruik van het nieuwe gen. In een deel van de cyclus ontstemt de gastheer zijn eigen code om de buitenaardse code te herkennen. Een voorbeeld van een dergelijk ontstemmingsproces is gedocumenteerd in streptomycine-afhankelijke mutanten (20, 21) en ribosomale ambiguïteitsmutanten (22, 23) in bacteriën. In het andere deel van de cyclus worden de vreemde gencodons gemuteerd om te voldoen aan de gastheercode. Dit proces resulteert in de detectie met grotere precisie van het buitenaardse signaal. Een momentopname van dit proces zou een genoom onthullen als een mozaïek van horizontaal overgedragen fragmenten van andere genomen met verschillende karakteristieke patronen van codongebruik. Dit is echter slechts het topje van de ijsberg: naast het gebruik van codons zijn er de subtiele maar belangrijke veranderingen in de precisie van aminoacyl-tRNA-synthetase en het ambiguïteitsniveau van het translationele mechanisme zelf.

De interactie tussen de genetische codes is aantrekkelijk. Typisch, hoe dichter de translatie van een vreemd coderend gebied bij die in de donor ligt, hoe groter de kans dat het functioneel is. Daarom zal de selectiedruk zijn om codons van de ontvangercode te veranderen in de richting van de donorcode, al is het maar op een probabilistische manier. Het dynamische resultaat van deze attractie moet uniformisering zijn. Deze verwachting wordt bevestigd door onderstaande computersimulaties.

HGT vereist dat de genetische codes van de gastheer en de ontvanger voldoende vergelijkbaar zijn, maar hoe vergelijkbaar voldoende is, hangt af van de aard van de eiwitten en de algehele nauwkeurigheid van decodering. Er zijn sterke redenen om aan te nemen dat hoe primitiever de code van de donor is, hoe groter de genetische codeafstand waarover HGT mogelijk is. Dit komt omdat de tolerantie van de eiwitten voor fouten in hun primaire structuur mede is aangepast aan de foutenpercentages van de translationele machinerie. Een cel met een niet-optimale code kan zich geen zeer grillige en daarom zeer verfijnde eiwitten veroorloven vanwege de kosten van het weggooien van defecte eiwitten. Een eiwit dat bestand is tegen vertaalfouten a fortiori is ook toleranter voor vertaling met een andere code. Omgekeerd geldt: hoe minder de ontvangercode is geoptimaliseerd, des te toleranter zijn eiwitten voor fouten en dus des te minder schadelijk het effect op de gevestigde genen van een codeverandering in de richting van de donorcode. Dit heeft als belangrijke consequentie dat in de beginfase van de genetische code-evolutie, toen de diversificatietendens van codes het sterkst was, HGT mogelijk was en uitgebreid moet zijn geweest ondanks de aanwezigheid van veel verschillende codes.

HGT van translationele componenten.

Tot nu toe is onze discussie erin geslaagd om de details van hoe de genetische code als het ware in hardware wordt geïmplementeerd, te vermijden. We kunnen echter niet voorbijgaan aan de mogelijkheid dat de translationele componenten zelf baat hebben gehad bij HGT, en we gaan hier nu kort op in.

De genetische code is een weergave van een familie van modules, die universeel zijn in alle organismen en worden gespecificeerd door de mechanismen van translatie, zoals tRNA's en opladende enzymen (aminoacyl-tRNA-synthetasen in een moderne setting). De taak om de vertaling en de code te verbeteren is ook universeel, d.w.z. grotendeels ongevoelig voor de niches die organismen bezetten. Dus, is het mogelijk dat HGT van translationele componenten een belangrijke rol heeft gespeeld in de evolutie van de codes? Is er enige betekenis in de functionele scheiding tussen de translationele machinerie (het ribosoom) en de codespecificaties (tRNA's en opladende enzymen)? Stel je voor de eenvoud een situatie voor waarin organismen die verschillende niches bezetten dezelfde kneedbare genetische code en ensembles van tRNA's hebben. De ontdekking van een tRNA-modificatie die de code verandert en de optimaliteit (en dus de efficiëntie van de vertaling) in het ene organisme verhoogt, zal ook gunstig zijn voor organismen in de andere niches, vanwege het universele voordeel van optimaliteit. Daarom is een verspreiding van de ontdekking gunstig voor alle ontvangers en kan worden aangenomen dat deze plaatsvindt via verschillende HGT-mechanismen, inclusief via actieve elementen zoals virussen en plasmiden.

Daarom, als de verspreiding via HGT snel is in vergelijking met innovaties, kan een kern van organismen met dezelfde genetische code zijn integriteit behouden en evolueren naar optimaliteit. Merk op dat dit mechanisme niet afhankelijk is van gemeenschappelijke voorouders en de diversiteit van de organismen behoudt.Bovendien onderscheidt dit mechanisme zich van elke overleving van een "geschiktste" soort. Bij afwezigheid van een aantrekkingskracht die afwijkende codes tegenhoudt, zou deze kern van organismen uitgeput raken, als er een omstandigheid was die verhinderde dat een code-update specifieke populaties binnendrong. Als de uitputting langzaam genoeg is, zullen de devianten een gemeenschappelijk nadeel hebben en verdwijnen zoals beschreven in Concurrentie tussen innovatiepools. Het uitputtingsmechanisme zal concurreren met een uitbreiding van de kern vanwege het voordeel van een gemeenschappelijk protocol dat door een grote populatie wordt gedeeld.

Diversificatie van het vertaalmechanisme.

De speciale rol van de genetische code als een protocol voor het delen van innovatie leidt tot een mogelijk observationeel gevolg. In een kerngemeenschap van organismen die bezig is met code-optimalisatie, wordt de compatibiliteit van codespecificaties afgedwongen. Zodra de optimalisatie van de genetische code is voltooid, is er geen druk meer om de compatibiliteit te behouden. Daarom zou het "bevriezen" van de universele genetische code de straling van de onderliggende vertaalmachines kunnen veroorzaken. Dus zelfs als de vertaling eerder opdook dan de andere basale cellulaire systemen, maar de optimalisatie van de code langer zou duren, zouden de translationele componenten minder gediversifieerd zijn. Dit komt overeen met de waarneming dat het translatiemechanisme evolutionair meer geconserveerd is dan de replicatie- en transcriptiemechanismen. Hoewel we geen volledig begrip hebben van de darwinistische overgang (18), suggereert ons argument dat universele code en optimaliteit noodzakelijke, maar niet voldoende mechanismen waren voor de overgang naar verticale evolutie.

Interacties tussen HGT-mechanismen.

De verschillende collectieve mechanismen die door HGT mogelijk worden gemaakt en hierboven zijn beschreven, zijn ook in staat om synergetisch met elkaar in wisselwerking te staan.

We zagen hierboven dat de evolutionaire uitbreiding van de meest populaire cluster van codes de nodige ondersteuning biedt voor het onderhoud van een anders zwak uitputtende universele kern. Het tegenovergestelde is ook waar. Het CIP-mechanisme is niet effectief als er geen clusters van voldoende omvang zijn waarop het kan werken. De oprichting van dergelijke clusters wordt in hoge mate vergemakkelijkt door de HGT van codespecificators en eiwitcoderende regio's. Distributie van modules dwingt modulariteit af die op zijn beurt de distributie van modules afdwingt. Evenzo dwingt de uitwisseling van eiwitcoderende regio's universaliteit af, waardoor het gemakkelijker wordt om genen uit te wisselen. Daarom zijn er positieve feedbacklussen die de protocollen ten minste lokale stabiliteit bieden en ze op een langere tijdschaal omzetten in effectieve vrijheidsgraden. De mondiale stabiliteit en universaliteit wordt dan gegarandeerd door het 'winner takes all'-karakter van het CIP.

HGT's van codespecificatoren en eiwitcoderende regio's werken niet alleen via het CIP-mechanisme, maar ook rechtstreeks samen. Als een organisme een gen verkrijgt uit een andere niche, is zijn plaats in het ecosysteem zodanig dat het potentieel contact heeft met het genetische materiaal van de donor. Daarom heeft de ontvanger een meer dan willekeurige kans om ook de juiste codespecificator van de donor te verkrijgen, voordat het speciale codongebruik van een recent verworven eigenschap afdrijft. De uitwisseling van codespecificaties biedt een kanaal waardoor codes meer op elkaar kunnen gaan lijken als reactie op het aantrekken van codes als gevolg van de uitwisseling van eiwitcoderende regio's.

Samengevat is het de wisselwerking tussen de verschillende hierboven geschetste mechanismen die de opkomst en instandhouding van universaliteit robuust maakt. Tegelijkertijd is het vanwege de complexiteit van het probleem nuttig om de verschillende componenten ook afzonderlijk te bestuderen.

HGT en de waargenomen statistische eigenschappen van de genetische code.

Tot nu toe hebben we betoogd dat HGT en de speciale rol van de genetische code als een protocol voor het delen van innovatie de conceptuele problemen bij het begrijpen van de gelijktijdige universaliteit en evolueerbaarheid van de genetische code verlichten. Helpt dit verbeterde begrip ons enkele van de statistische kenmerken van de moderne genetische code te verklaren? En hoe kunnen we de kenmerken van de bovengenoemde mechanismen blootleggen die begraven liggen in het functionele en structurele ontwerp van het translationele systeem en zijn fylogenetische variaties?

Om dit aan te pakken, moet men de bovengenoemde generieke mechanismen aanvullen met inzicht in de elementaire evolutionaire veranderingen van de genetische code. Ons doel in de rest van dit artikel is om te proberen robuuste of generieke statistische eigenschappen van vertaling te identificeren die voortkomen uit onze voorgestelde evolutionaire mechanismen, maar die relatief ongevoelig zijn voor fijne details. Om te beginnen modelleren we het code-aantrekkingsmechanisme en vragen we: Wat is het effect van HGT op de optimaliteit van de genetische code?

We gebruiken genetische codedynamiek die vergelijkbaar is met die voor het eerst geïntroduceerd door Sella en Ardell (24-26). Het belangrijkste kenmerk is de co-evolutie tussen de genetische code en het codongebruik op verschillende functionele locaties. De code bepaalt het codongebruik bij mutatieselectie-evenwicht. Op zijn beurt bepaalt het codongebruik de fitnesskosten of baten van de toegankelijke codewijzigingen, waardoor de evolutie van de code wordt geleid. Codewijzigingen die gunstig zijn gezien het typische codongebruik van een populatie, kunnen deze binnendringen. Om HGT te verklaren, koppelen we de evolutie van verschillende codes door te stellen dat een fractie van elk genoom bestaat uit stukjes die afkomstig zijn van andere genomen.

De verdienste van het model van Sella en Ardell is dat het een gesloten model is van de evolutie van de genetische code en aantoont dat de barrière voor evolueerbaarheid overkomelijk is in een door eiwitten gedomineerde wereld. De tekortkoming is dat het niet ingaat op het feit dat vertalen een dynamisch proces is, met concurrentie tussen de verschillende componenten ervan. Dit betekent dat het model van Sella en Ardell op zichzelf niet voldoende is om generieke statistische handtekeningen van de evolutionaire mechanismen van vertaling te identificeren, omdat de statistische eigenschappen van de code en de structuur van het translationele systeem precies de stabiele resoluties zijn van de ontwerptrade-offs en evolutionaire conflicten die inherent zijn aan vertaling.

Het code-aantrekkingsmechanisme dat we op dit punt gebruiken, is ook ongevoelig voor de implementatie van vertaling en heeft dus dezelfde tekortkoming. Dus als we het combineren met het model van Sella en Ardell, zullen we nog steeds niet in staat zijn om alle evolutionaire aspecten van het probleem aan te pakken. Desalniettemin kan een dergelijk model, hoewel weliswaar te eenvoudig voor onze uiteindelijke doelen, bemoedigend toch de universaliteit en optimaliteit van de genetische code verklaren. Het enige belangrijke aspect van vertaling dat moet worden opgenomen, zelfs als het met de hand wordt ingevoerd, is een verkeerde vertaling.

Op een volgend niveau in de hiërarchie van modellen, moet men de tRNA's opnemen als agenten van zowel de collectieve moleculaire inspanning van translatie als de gemeenschappelijke evolutie van de genetische codes. In tegenstelling tot het bovenstaande zou in dergelijke modellen een verkeerde vertaling een dynamische variabele worden die voortkomt uit de concurrentie zelf. Dit lagere niveau van beschrijving brengt een rijkere reeks waarnemingsresultaten met zich mee en biedt een unieke en essentiële rol voor het organisme als resourcemanager en conflictregulator voor de verschillende dynamische processen daarbinnen.


Herbold Computational Biology Program

Het Herbold Computational Biology Program werd in 2007 opgericht met de steun van Bob en Pat Herbold. We combineren traditionele biologische wetenschappen met geavanceerde opleidingen in natuurkunde, statistiek, wiskunde en informatica. Door computationele methoden en hulpmiddelen te gebruiken om biologische vragen aan te pakken, onderzoeken we wat ooit puur experimenteel of puur computationeel/statistisch was, waardoor ons programma nieuwe onderzoeksgebieden kan aanpakken.

Het combineren van kwantitatieve wetenschap en computationele biologie met traditionele disciplines wordt gedeeltelijk gedwongen door een explosie van informatie over de moleculaire machinerie van levende organismen. Onderzoeksaanjagers omvatten de sequentie van het menselijk genoom en zijn producten, evenals de beschikbaarheid van biotechnologieën die moleculaire machines op genoomschaal meten.

Faculteit en Labs

Onze faculteitsleden hebben expertise in transcriptie / vertalingscontrole, adaptieve immuunsysteemdynamiek en fylogenetica.

Bekijk het laatste nieuws over onze programmawetenschappers, onderzoek, subsidies en ontdekkingen.


Bekijk de video: DNA Replikation - Wie funktionierts?! Gehe auf u0026 werde #EinserSchüler (November 2021).