Informatie

Voorspellen hoe eiwitten worden gesplitst


Is het mogelijk om te voorspellen hoe eiwitten gecodeerd uit mRNA zullen worden gesplitst?

De reden dat ik hierin geïnteresseerd was, is omdat ik wat eerste werk heb gedaan om de ruwe RNA-sequenties van het Coronavirus te vertalen, die je hier kunt zien: https://github.com/imranq/coronavirus. De achtergrondsectie hieronder bevat meer informatie over mijn aanpak.

Met de "naïeve" benadering om coronavirus-RNA te vertalen, met AUG als startcodon, ben ik in staat om 7 van de 24 eiwitten uit Zhang-labsequenties te identificeren. Ik heb echter ook wat string-matching gedaan tussen mijn aminozuursequenties en de definitieve aminozuursequenties van het Zhang-lab. Nadat ik die vergelijking heb gemaakt, zie ik dat ik 21 van de 24 eiwitsequenties heb gecodeerd in niet-gesplitste eiwitsequenties.

Het zou mooi zijn om de laatste 24 eiwitten rechtstreeks van de mRNA-streng te krijgen. Help alstublieft. Bedankt!

Achtergrond

Hier is de reeks stappen die ik heb gebruikt om coronavirus-RNA om te zetten in eiwitten.

1. De onbewerkte RNA-sequenties zijn hier (afkomstig van de NIH): https://github.com/imranq/coronavirus/blob/main/data/rawrna.json 2. Het script om het RNA te vertalen is hier (aangenomen dat AUG het startcodon): https://github.com/imranq/coronavirus/blob/main/scripts/translate.js De vertaalde eiwitsequenties zijn hier: https://github.com/imranq/coronavirus/blob/main/data /processed/translatedProteins.json 3. Het script dat wordt gebruikt om een ​​vergelijking tussen de vertaalde eiwitten en de bekende eiwitsequenties te genereren, is hier (gebruikmakend van levenshtein-afstand als onze verschilmetriek): https://github.com/imranq/coronavirus/blob/ main/scripts/compareTranslated.js De gegevens die uit dat script worden gegenereerd, zijn hier https://github.com/imranq/coronavirus/blob/main/data/processed/translatedComparison.json 4. Vervolgens detecteren we splitsing in eiwitten door een glijdende venster over RNA-segmenten tussen de bekende en vertaalde eiwitten. Het script om dit te doen is hier: https://github.com/imranq/coronavirus/blob/main/scripts/detectCleavage.js 4. Ten slotte voegen we de datasets die we hebben gegenereerd uit translatie- en eiwitcomplexen samen tot één dataset, vertaalde eiwitten en eiwitcomplexen die overeenkomen met bekende eiwitten. De gegevens die met dit algoritme worden gegenereerd, bevinden zich hier https://github.com/imranq/coronavirus/blob/main/data/processed/mergedProteins.json

Aan het einde van deze pijplijn krijgen we 21 van de 24 eiwitten die rechtstreeks uit RNA zijn gematcht.

Referenties:

Hier zijn de artikelen / artikelen die ik heb onderzocht om deze vraag te beantwoorden

Genoomgegevens omzetten in eiwitten

Khan Academy genetische code: https://www.khanacademy.org/science/ap-biology/gene-expression-and-regulation/translation/a/the-genetic-code-discovery-and-properties

Zhan Lab - SARS CoV 2 - Nucleotide-, codeergebied- en eiwitsequenties https://zhanglab.ccmb.med.umich.edu/COVID-19/

Meer in de readme hier: https://github.com/imranq/coronavirus/blob/main/README.MD


Google AI lost al lang bestaand, bijna onmogelijk biologieprobleem op

Het DeepMind-team van Google heeft een algoritme voor kunstmatige intelligentie ontwikkeld dat een biologische uitdaging lijkt te hebben gekraakt die zo ingewikkeld is dat het decennialang bijna onmogelijk leek.

DeepMind kondigde maandag in een blogpost aan dat zijn wetenschappers een algoritme hebben ontwikkeld, AlphaFold 2, dat een oplossing biedt voor het zogenaamde eiwitvouwprobleem: een ambitieuze wetenschappelijke onderneming met als doel de vorm van eiwitten uitsluitend op basis van hun samenstelling te voorspellen. Het voorspellen van de eiwitstructuur zal de biomedische wetenschap enorm verbeteren en artsen in staat stellen nog sneller nieuwe behandelingen te ontwikkelen.


G4. Voorspelling van membraaneiwitstructuur

  • Bijgedragen door Henry Jakubowski
  • Professor (Chemie) aan het College van St. Benedict/St. John's Universiteit

Tot nu toe hebben we voornamelijk globulaire eiwitten besproken die oplosbaar zijn in water. Eiwitten worden ook gevonden geassocieerd met membranen. In de natuur worden twee hoofdklassen van membraaneiwitten aangetroffen.

  • perifere membraaneiwitten: in water oplosbare eiwitten binden reversibel en niet-covalent aan het membraan door elektrostatische aantrekkingen tussen geladen polaire kopgroepen van de fosfolipiden en het eiwit. Deze eiwitten kunnen vaak van het membraan worden vrijgemaakt door toevoeging van een hoog zoutgehalte, omdat ze vaak worden aangetrokken door de dubbellaag door elektrostatische interacties tussen geladen fosfolipidekopgroepen en polaire/geladen groepen op het eiwitoppervlak.
  • integrale membraaneiwitten: eigenlijk invoegen in de dubbellaag. Deze kunnen van het membraan worden vrijgemaakt en effectief worden opgelost door toevoeging van amfifielen met een enkele keten (detergentia) die een gemengde micel vormen met het integrale membraaneiwit. Niet-ionische detergentia (Trition X-100, octylglucoside, enz.) worden vaak gebruikt bij de zuivering van membraaneiwitten. Ionische detergentia (zoals SDS) lossen niet alleen de integrale membraaneiwitten op, maar denatureren ze ook.

Figuur: Soorten membraaneiwitten

In sommige van deze integrale membraaneiwitten zijn grote extracellulaire en intracellulaire domeinen van het eiwit aanwezig, verbonden door de intramembraangebieden. Het intramembraan overspannende gebied bestaat vaak uit ofwel een enkele alfa-helix, of 7 verschillende spiraalvormige gebieden die door het membraan zigzaggen. Deze transmembraansequenties kunnen gemakkelijk worden bepaald door middel van hydropathieberekeningen. Beschouw bijvoorbeeld het integrale membraan rundereiwit rhodopsine. De volgorde van 348 aminozuren (in een enkele lettercode) wordt hieronder weergegeven:

MNGTEGPNFYVPFSNKTGVVRSPFEAPQYYLAEPWQFSMLAAYMFLLIMLGFPINFLTLY
VTVQHKKLRTPLNYILLNLAVADLFMVFGGFTTTLYTSLHGYFVFGPTGCNLEGFFATLG
GEIALWSLVVLAIERYVVVCKPMSNFRFGENHAIMGVAFTWVMALACAAPPLVGWSRYIP
EGMQCSCGIDYYTPHEETNNESFVIYMFVVHFIIPLIVIFFCYGQLVFTVKEAAAQQQES
ATTQKAEKEVTRRMVIIMVIAFLICWLPYAGVAFYIFTHQGSDFGPIFMTIPAFFAKTAV
YNPVIYIMMNKQFRNCMVTTLCCGKNPLGDDEASTTVSKTETSQVAPA

Rhodopsine hydropathie plot berekeningen laten zien dat het zeven transmembraan helices bevat die op een kronkelige manier door het membraan kronkelen.

Figuur: Rhodopsine hydropathie plot

Figuur: zeven transmembraanhelices

Resultaten van rodopsinehydropathie

Nee. N-terminal transmembraangebied C-aansluiting type lengte
1 40 LAAYMFLLIMLGFPINFLTLYVT 62 PRIMAIRE 23
2 71 PLNYILLNLAVADLFMVFGGFTT 93 ONDERGESCHIKT 23
3 113 EGFFATLGGEIALWSLVVLAIER 135 ONDERGESCHIKT 23
4 156 GVAFTWVMALACAAPPLVGWSRY 178 ONDERGESCHIKT 23
5 207 MFVVHFIIPLIVIFFCYGQLVFT 229 PRIMAIRE 23
6 261 FLICWLPYAGVAFYIFTHQGSDF 283 PRIMAIRE 23
7 300 VYNPVIYIMMNKQFRNCMVTTLC 322 ONDERGESCHIKT 23

Samengevat zijn hydropathiegrafieken daarom nuttig bij het vinden van begraven gebieden in wateroplosbare eiwitten, transmembraanhelices in integrale membraaneiwitten evenals korte stukken polaire/geladen aminozuren die oppervlaktelussen zouden kunnen vormen die herkenbaar zijn door antilichamen van het immuunsysteem. De venstergrootte die in hydropathieplots wordt gebruikt, zou uiteraard van invloed zijn op de berekende resultaten. Vensters van 20 aminozuren zijn nuttig om transmembraanhelices te bepalen, terwijl vensters van 5-7 aminozuren worden gebruikt om aan het oppervlak blootgestelde hydrofiele plaatsen te vinden.

Membraaneiwitten worden opgelost door toevoeging van amfifielen met een enkele keten (detergentia). De niet-polaire staarten van de detergentia interageren met het hydrofobe transmembraandomein van het membraaneiwit en vormen een "gemengde" micelachtige structuur. Niet-ionische detergentia zoals Triton X-100 en octyl-glucoside worden vaak gebruikt om membraaneiwitten in hun bijna natuurlijke staat op te lossen. Daarentegen denatureren ionische detergentia zoals natriumdedecylsulfaat (met een negatief geladen kopgroep) eiwitten tijdens het solubilisatieproces. Om membraaneiwitten in een meer natieve omgeving te bestuderen, kunnen eiwitten die oplosbaar zijn gemaakt door een niet-ionisch detergens worden gereconstitueerd in tweelagige liposoomstructuren met behulp van methoden die vergelijkbaar zijn met die van Lab 1 waarin u met kleurstof ingekapselde grote unilamellaire blaasjes (LUV's) hebt bereid. Het kan echter moeilijk zijn om de intra- en extracellulaire domeinen van membraaneiwitten in liposomen te bestuderen, aangezien een van die domeinen verborgen is in het liposoom. Onlangs heeft Sligar een nieuwe techniek ontwikkeld die deze barrière wegneemt. Hij creëerde een amfifiele eiwitschijf met een opening in het midden. De binnenste opening is bekleed met niet-polaire resten, terwijl het buitenoppervlak van de schijf polair is. Toen de schijven aan fosflipiden werden toegevoegd, vormden zich kleine dubbellagen in de schijf. Membraaneiwitten zoals de b-2-adrenerge receptor zouden kunnen worden gereconstitueerd in de nanodisc-dubbellagen, waardoor blootstelling aan oplosmiddelen van zowel de intracellulaire als extracellulaire domeinen van het receptoreiwit mogelijk is.


AlphaFold is ontstaan ​​uit diep lerende schaak-, Go- en pokerspellen

Het succes van DeepMinds voorspellingsprogramma voor het vouwen van eiwitten, AlphaFold genaamd, is niet onverwacht. Andere diepgaande leerprogramma's geschreven door DeepMind hebben 's werelds beste schaak-, Go- en pokerspelers vernietigd.

In 2016 was Stockfish-8, een open-source schaakengine, 's werelds computerschaakkampioen. Het evalueerde 70 miljoen schaakposities per seconde en had eeuwen van geaccumuleerde menselijke schaakstrategieën en tientallen jaren computerervaring om uit te putten. Het speelde efficiënt en brutaal en versloeg al zijn menselijke uitdagers genadeloos zonder een greintje finesse. Voer diep leren in.

Op 7 december 2017 versloeg het diepgaande schaakprogramma AlphaZero van Google Stockfish-8. De schaakengines speelden 100 games, waarbij AlphaZero 28 won en 72 gelijk maakte. Er werd geen enkele game verloren. AlphaZero deed slechts 80.000 berekeningen per seconde, in tegenstelling tot de 70 miljoen berekeningen van Stockfish-8.

AlphaZero heeft niets geleerd van mensen of schaakspellen die door mensen worden gespeeld. Het leerde zichzelf en leidde in het proces strategieën af die nog nooit eerder waren gezien. In een commentaar in het tijdschrift Science schreef voormalig wereldkampioen schaken Garry Kasparov dat AlphaZero, door te leren van het spelen zelf, strategieën ontwikkelde die "de waarheid" van schaken weerspiegelen in plaats van "de prioriteiten en vooroordelen" van de programmeurs. "Het is de belichaming van het cliché 'werk slimmer, niet harder'."

Hoe vouwen eiwitten?


Voorspelling van eiwitstoornis uit aminozuursequentie

Structurele wanorde is van vitaal belang voor de functie van eiwitten in diverse biologische processen. Het is daarom zeer wenselijk om de mate van orde en wanorde uit de aminozuursequentie te kunnen voorspellen. Onderzoekers hebben een voorspellingstool ontwikkeld door machine learning te gebruiken in combinatie met experimentele NMR-gegevens voor honderden eiwitten, die naar verwachting nuttig zal zijn voor structurele studies en het begrijpen van de biologische rol en regulatie van eiwitten met ongeordende regio's.

Anfinsen toonde in de vorige eeuw onomstotelijk aan dat een eiwit zijn weg terug kan vinden naar zijn 'oorspronkelijke' driedimensionale structuur nadat het onder 'denaturerende omstandigheden' is geplaatst waarbij de eiwitstructuur wordt ontvouwd. De diepgaande conclusie van zijn experimenten was dat blijkbaar de informatie die het zoeken naar de oorspronkelijke staat regelt, verborgen is in de aminozuursequentie. Thermodynamische overwegingen schetsten vervolgens een visie waarbij het vouwproces is als energetisch bergafwaarts rollen naar het laagste punt - naar de unieke oorspronkelijke structuur. Deze bevindingen zijn vaak verweven met het centrale dogma van de moleculaire biologie. Een gen codeert dus voor een aminozuursequentie en de sequentie codeert voor een specifieke structuur.

Voer intrinsiek ongeordende eiwitten in.

De volgende doorbraak kwam met de komst van goedkope en snelle genoomsequencing in de nasleep van het menselijk genoomproject toen duizenden genomen van verschillende organismen waren gesequenced, wetenschappers een duizelingwekkende ontdekking deden - er waren heel veel genen die codeerden voor eiwitten met lage complexiteit. Met andere woorden, deze eiwitten bevatten niet de juiste aminozuren om op te vouwen en experimenten bevestigden dat ze 'intrinsiek ongeordend' bleven. Ook bleek het menselijk genoom meer dan een derde van zijn genen te hebben die coderen voor eiwit disvolgorde!

Hoe een eiwitstoornis te detecteren?

Omdat ongeordende eiwitten erg flexibel zijn, zijn ze niet vatbaar voor kristallisatie en daarom kan er geen informatie worden verkregen uit röntgendiffractie op eiwitkristallen - de benadering die zo cruciaal is geweest voor gevouwen eiwitten. In plaats daarvan moeten deze eiwitten in oplossing worden bestudeerd en daarvoor is NMR (Nuclear Magnetic Resonance) spectroscopie het meest geschikte hulpmiddel. Bij deze methode wordt een kwantumfysische eigenschap genaamd 'spin' gemeten in een sterk magnetisch veld voor elk atoom in het molecuul. De exacte precessiefrequenties van de spins zijn een functie van hun omgeving, en het is precies deze frequentie die onderzoekers in staat stelt kwantitatief te meten in welke mate elk aminozuur geordend of ongeordend is in het eiwit.

In hun nieuwe paper, gepubliceerd op 8 september 2020, hebben Dr. Rupashree Dass samen met universitair hoofddocent Frans Mulder en universitair docent Jakob Toudahl Nielsen machine learning samen met experimentele NMR-gegevens voor honderden eiwitten gebruikt om een ​​nieuwe bioinformatica-tool te bouwen die ze hebben genoemd ODiNPred. Dit bio-informaticaprogramma kan andere onderzoekers helpen om de best mogelijke voorspellingen te doen over welke regio's van hun eiwitten rigide zijn en welke waarschijnlijk flexibel zijn. Deze informatie is nuttig voor structurele studies, evenals voor het begrijpen van de biologische rol en regulatie van intrinsiek ongeordende eiwitten.


Hoe komen eiwitten de mitochondriën binnen?

Als het binnenmembraan zo ondoordringbaar is, hoe komen eiwitten dan binnen?

Het buitenmembraan van de mitochondriën bevat het eiwit "porine". Dit vormt een waterig kanaal waardoor eiwitten tot 10.000 dalton kunnen passeren en in de intermembrane ruimte kunnen gaan. Inderdaad, de kleine moleculen komen in feite in evenwicht tussen het buitenmembraan en het cytosol. De meeste eiwitten kunnen echter niet in de matrix komen tenzij ze door het binnenmembraan gaan. Dit membraan bevat cardiolipine waardoor het vrijwel ondoordringbaar is. Dit vereist transportmechanismen over het membraan die meer georganiseerd en gereguleerd zijn. Een heel eenvoudig beeld van het proces is schematisch weergegeven in deze cartoon.

Dit cijfer is ontleend aan Alberts et al, Molecular Biology of the Cell, Garland Publishing, N.Y. 1994, derde editie

Transport over de mitochondriale membranen vereist de gezamenlijke actie van een aantal translocatiemachines. De machinerie in het buitenste membraan wordt het Tom-complex genoemd (tdoorzoekfunctie Obaarmoeder membrane) en dat voor het binnenmembraan het Tim-complex wordt genoemd (tdoorzoekfunctie lnner membraan). Eiwitten die helemaal naar de matrix moeten gaan hebben een NH2 splitsbare signaalsequentie (zie de bovenstaande cartoon).

De meeste eiwitten moeten worden afgewikkeld of uitgerekt om door de translocators te gaan. Dit omvat ATP-binding en wordt gevolgd en gestabiliseerd door een chaperonne-eiwit, waaronder hsp70. Dus voordat het eiwit door het Tom-complex kan gaan, moet het "translocatie-competent" worden.

Transport door het buitenmembraan: kenmerken van het Tom-complex.

Het is niet verrassend dat het TOM-complex importreceptoren zal bevatten die in eerste instantie het signaalpeptide of een signaalsequentie herkennen (deze omvatten Tom20, Tom22 en Tom70). Verschillende eiwitten gebruiken verschillende receptoren. In de bovenstaande cartoon wordt de receptor weergegeven als een blauwe ovaal waarin het signaalpeptide is ingebracht. De receptoren brengen het eiwit vervolgens naar het gebied dat de translocator-eiwitten bevat. Dit is eigenlijk een complex van eiwitten.
Het wordt de General Import Pore (GIP) genoemd en het vergemakkelijkt de translocatie van de presequentie van het eiwit door het buitenmembraan. (de GIP is gemaakt van Tom40, Tom5, Tom 6 en Tom7). Tom40 blijkt het kernelement van de porie te zijn en vormt oligomeren. Het doorkruist het membraan als een reeks van 14 anti-parallelle bèta-strengen die een bèta-vat vormen. Het interageert ook met polypeptideketens die door de porie gaan. Alle andere Tom-componenten in GIP zijn verankerd aan het buitenmembraan door middel van spiraalvormige transmembraansegmenten (hydrofobe ankers).

Recente studie van Tom40: Rapaport, D en Neupert W, Biogenese van Tom40, kerncomponent van het TOM-complex van mitochondriën. J Cell Biol 146 321-332, 1999. Studie onderzocht hoe Tom40 het buitenmembraan binnenging en een deel van de GIP werd. De studie meldde dat:

  • Ten eerste, zoals bij veel mitochondriale eiwitten, heeft Tom40 cytosolische chaperonnes nodig om het voor te bereiden op binnenkomst. In het geval van dit eiwit vereist het "translocatiecompetent" ATP en een gedeeltelijk gevouwen toestand (de laatste wordt gemedieerd door de cytosolische chaperonne (hsp70).
  • Ten tweede, wanneer het "competent" is, interageert het met de oppervlaktereceptor, Tom20. Er is echter geen splitsbaar signaalpeptide, maar de experimenten die de vereiste voor gedeeltelijke vouwing laten zien, suggereren dat targeting-informatie wordt gevonden in discontinue plaatsen die in het gevouwen domein zijn samengebracht.
  • De definitieve insertie is in reeds bestaande Tom-complexen. Dit vereist een intacte N-terminus.
  • Dimerisatie vindt plaats na binnenkomst in het membraan.

Kenmerken van Tim-complexen

Mitochondriale eiwitten die bestemd zijn voor de matrix hebben vaak een splitsbaar signaalpeptide op het eiwit dat moet worden herkend voordat het door de mitochondriale translocator wordt toegelaten. Deze eiwitten met "aminoterminale signalen" (uw tekst), of "preproteïnen" of "presequenties" (huidige literatuur) werken meestal eerst met Tom20. Dan moeten ze door het buitenmembraan. Om dat te doen, worden ze overgebracht naar het GIP-complex: eerst interageren ze met Tom22 en Tom5, wat hen naar de porie leidt die wordt gevormd door Tom40. Ze gaan dan de matrix binnen met behulp van het poriecomplex gemaakt van Tim23 en Tim17 die zich in het binnenmembraan bevinden. Ook, heel belangrijk, hun binnenkomst is afhankelijk van de membraanpotentiaal. Dit wordt opgezet door de elektronentransportcomplexen. Bedenk dat waterstofionen in de intermembraanruimte worden gepompt, waardoor een ladingsgradiënt ontstaat die negatiever is op de matrixplaats. Dit membraanpotentieel helpt het eiwit in de Tim23-Tim17-kanalen te trekken. Het eiwit komt dan de matrix binnen waar het splitsbare pre-eiwit wordt afgekapt door een protease, MPP. mthsp 70 in de matrix werkt met Tim44 om de volledige overdracht naar de matrix te voltooien. mthsp70 en Tim 44 "trekken" het eiwit in feite in de matrix door een proces dat ATP vereist. Het vereist ook de membraanpotentiaal die is ingesteld door de elektronentransportketen.

Sommige mitochondriale eiwitten die bestemd zijn voor het binnenmembraan hebben een splitsbare presequentie gevolgd door een of meer hydrofobe membraan-omspannende segmenten die fungeren als stop-transfersequenties in het IM of dienen om het polypeptide in het IM in te voegen nadat het in de matrix is ​​terechtgekomen. Deze zijn vergelijkbaar met de Type I-membraaneiwitten die worden beschreven in de eenheid op het ruwe endoplasmatisch reticulum.

Andere eiwitten hebben echter geen splitsbaar targetingsignaal (type II en III). Mitochondriale eiwitten die een interne signaalsequentie hebben (voorbeelden omvatten een aantal eiwitten in het binnenmembraan) interageren over het algemeen met Tom70 als de receptor. Daarna, nadat ze het buitenmembraan via het GIP-complex hebben gepasseerd, komen ze in de speciale Tim-route. Dit kan interacties inhouden met kleine Tim's van de intermembraanruimte en Tim22-Tim54 van het binnenmembraan zelf.

Die eiwitten die geen splitsbare signaalvolgorde hebben, hebben vaak signalen met de volgende kenmerken: Ze zijn vaak een stuk van positief geladen aminozuren (soms grenzend aan een membraan dat hydrofoob gebied overspant). Soms vormen deze lussen die naar de matrix zijn gericht. Denk aan de "positieve regel van binnenuit" heeft positief geladen aminozuren geconcentreerd aan de cytosolische kant voor eiwitten die in het ruwe endoplasmatisch reticulum worden ingebracht. Deze mitochondriale eiwitten hebben de neiging om deze regel te volgen, alleen de matrix wordt de plaats waar de positieve ladingen het talrijkst zijn.

Voorbeelden uit de literatuur:

Davis, AJ, Ryan, KR en Jensen, RE Tim23p bevat afzonderlijke en verschillende signalen voor targeting op mitochondriën en insertie in het binnenmembraan. Moleculaire biologie van de cel 9: 2577-2593 (1999).

  • Tim23 is een van de translocator-eiwitten van het binnenmembraan. Het heeft geen aminoterminale presequentie. Targeting-informatie wordt gevonden in het rijpe eiwit.
  • Tim23 heeft 4 transmembraansegmenten en twee positief geladen lussen die naar de matrix zijn gericht. Wat is nodig om een ​​import te signaleren?
  • Positief geladen aminozuren in één of beide lussen vervangen door alanineresiduen.
  • Ten minste één van deze lussen is vereist voor het inbrengen in het binnenmembraan.
  • Het signaal voor targeting op mitochondriën wordt gevonden in ten minste twee van de hydrofobe transmembraansegmenten.

Kurz, M, Martin, H, Rassow J, Pfanner, N, en Ryan, MT. Biogenese van Tim-eiwitten van de mitochondriale dragerimportroute: differentiële targetingmechanismen en kruising met de belangrijkste importroute. Moleculaire biologie van de cel 10: 2461-2474 (1999). Vergeleken met de route en binding van drie Tim-eiwitten

  • Tim54 draagt ​​een aminoterminale, niet-gesplitste translocatiesequentie die positief geladen is. Het geeft er echter de voorkeur aan Tom70 als zijn receptor te gebruiken in plaats van Tom20. Nadat het door de GIP is gegaan, gebruikt het zijn positief geladen aminoterminale sequentie om de matrix binnen te gaan. Er waren chaperonnes en ATP nodig om bij de matrix te komen.
  • Tim22 is een hydrofoob eiwit dat Tom20 gebruikt voor targeting op het OM. Daarna volgt het de Tim-route voor dragereiwitten, zoals Tim23. Het vereist geen hsp70 of ATP voor toegang.
  • Kleine Tims worden normaal gesproken gevonden in de intermembrane ruimte en zijn geen membraaneiwitten. Ze gebruikten Tom20 voor hun receptor en transfer naar het GIP-complex. Toen Tom20 echter werd vernietigd door trypsine, waardoor alleen Tom5 overbleef, konden de kleine Tims naar binnen.

De bovenstaande cartoon uit je tekst laat meer manieren zien waarop eiwitten in binnen- en buitenmembranen kunnen worden ingebracht, zodra ze worden herkend door de receptoren. Zoals blijkt uit eiwitten in de bovenstaande literatuurvoorbeelden, gebruiken de mitochondriën zowel positief geladen signalen als membraanoverspannende hydrofobe sequenties om te transloceren en vervolgens hun eindbestemming te bereiken. Zoals in de bovenstaande voorbeelden kunnen er meerdere signaal- en invoegplaatsen zijn. De verdeling van de geladen aminozuren helpt het eiwit echter zo te oriënteren dat de positieve ladingen zich in de matrix bevinden. Dit is hoe de cytochromen in de ademhalingsketen of de elementaire deeltjes worden ingebracht door mitochondriale acties.

Dit cijfer is ontleend aan Alberts et al, Molecular Biology of the Cell, Garland Publishing, N.Y. 1994, derde editie

De volgende afbeelding komt uit een andere tekst van Lodish et al, Molecular Cell Biology. Het toont de volledige opeenvolging van gebeurtenissen die nodig zijn om een ​​eiwit in de matrix te brengen.

  • Stap 1: Eiwit ontvouwt zich terwijl het zich bindt aan hsp70 chaperonne. Rood positief gebied geeft de doelvolgorde aan. De chaperonnebinding is ATP-afhankelijk.
  • Stap 2: Targeting-sequentie bindt aan receptor (meestal Tom20)
  • Stap 3. Receptor brengt eiwit naar de plaats van translocator. Andere Tom-eiwitten zijn betrokken, maar Tom40 is de kern van het translocatorkanaal.
  • Stap 4: Eiwit wordt getransloceerd gestimuleerd door de membraanpotentiaal. Elektronentransportcomplexen op het binnenmembraan hebben H+ naar de intermembraanruimte gepompt, waardoor de matrix negatiever is geworden. Dit trekt het eiwit aan (het signaal is positief geladen). Eiwit beweegt door Tim-translocators. Tim 44 en hsp70 in de matrix blijven het eiwit geleiden en door de porie trekken. Een ATP vereist proces.
  • Stap 5. een andere chaperonne (een chaperonine genoemd), hsp60 veroorzaakt de vouwing van het eiwit in zijn tertiaire sequentie. Ook een ATP vereist proces.
  • Stap 6. Presequentie wordt in de matrix gesplitst.

Wat gebeurt er als een importeiwit defect is?

Onderzoek naar gist heeft ons geholpen meer te weten te komen over de receptor en de translocatiemachinerie bevat een complex van eiwitten die samenwerken om toegang mogelijk te maken. In gist worden deze de MOMX genoemd. reeks, waarbij het nummer het eiwitnummer aangeeft. Een belangrijk eiwit bij de herkenning van het signaalpeptide en zijn binding aan de receptor wordt "MOM19" genoemd. MOM 19 werkt samen met MOM 72 om de eiwitten te herkennen en te binden. Dan helpt MOM22 het eiwit om van de receptorbindingsplaats naar het invoegpunt op het buitenmembraan te gaan. Het belang van MOM19 kan worden aangetoond door antistoffen aan MOM19 toe te voegen en import te blokkeren.

In een recent artikel van Harkness et al (J Cell Biology 124: 637-648, 1995), creëerden ze mutante gistcellen die een defect gen voor MOM19 bevatten.

Ze bevatten ook een geneesmiddelresistente marker zodat ze selectief cellen konden laten groeien met het mutante gen (in aanwezigheid van het geneesmiddel, p=fluorfenylalanine of fpa). Dus hoe langer de cellen in het medicijn groeien, hoe meer medicijnresistente mutante cellen zullen worden gevonden. De bovenstaande elektronenmicrofoto's zijn van hun papier (hierboven geciteerd). Ze tonen het resultaat van het afwezige MOM19-eiwit. Wat is afwezig in de cellen die 16 of 32 uur in het medicijn zijn gekweekt?

Welke eiwitten ontbraken toen ze de tests voor de eiwitten deden? Tests toonden aan dat er een dramatische afname was in het grootste deel van de ademhalingsketen (elektronentransportketen), inclusief cytochromen a/a3 en b. Cytochroom C was echter onaangetast. Dit suggereert dat een ander eiwit zijn import moet beheersen.


Handboek voor het bereiden van eiwitten

Lees meer over het ontzouten, bufferen, concentreren en/of verwijderen van verontreinigingen uit eiwitmonsters, immunoprecipitatie en andere methoden voor het zuiveren en opruimen van eiwitten met behulp van verschillende Thermo Scientific-hulpmiddelen voor eiwitbiologie in dit 32-pagina's tellende handboek.

  • Immunoprecipitatie (IP), co-IP en chromatine-IP
  • Recombinante eiwitzuiveringstags
  • Dialyseer eiwitmonsters veilig met Slide-A-Lyzer dialysecassettes en apparaten
  • Snel ontzouten van monsters met hoog eiwitterugwinning met behulp van Zeba spin-ontzoutingskolommen en -platen
  • Extraheer op efficiënte wijze specifieke verontreinigingen met behulp van harsen die zijn geoptimaliseerd voor verwijdering van detergenten of endotoxinen
  • Concentreer verdunde eiwitmonsters snel met behulp van Pierce-eiwitconcentratoren

Kom meer te weten

Selecteer producten

Eiwitinteracties worden fundamenteel gekarakteriseerd als stabiel of van voorbijgaande aard, en beide soorten interacties kunnen sterk of zwak zijn. Stabiele interacties zijn die welke zijn geassocieerd met eiwitten die worden gezuiverd als complexen met meerdere subeenheden, en de subeenheden van deze complexen kunnen identiek of verschillend zijn. Hemoglobine en kern-RNA-polymerase zijn voorbeelden van interacties met meerdere subeenheden die stabiele complexen vormen.

Van voorbijgaande interacties wordt verwacht dat ze de meeste cellulaire processen beheersen. Zoals de naam al aangeeft, zijn tijdelijke interacties tijdelijk van aard en vereisen ze doorgaans een reeks voorwaarden die de interactie bevorderen, zoals fosforylering, conformationele veranderingen of lokalisatie naar afzonderlijke delen van de cel. Tijdelijke interacties kunnen sterk of zwak zijn, en snel of langzaam. Terwijl ze in contact staan ​​met hun bindende partners, zijn transiënt interagerende eiwitten betrokken bij een breed scala aan cellulaire processen, waaronder eiwitmodificatie, transport, vouwing, signalering, apoptose en celcycli. Het volgende voorbeeld geeft een illustratie van eiwitinteracties die apoptotische en anti-apoptotische processen reguleren.


Zware SLECHTE eiwit-eiwit interactie. Paneel A: Coomassie-gekleurde SDS-PAGE-gel van recombinant licht en zwaar BAD-GST-HA-6xHIS gezuiverd uit HeLa IVT-lysaten (L), met behulp van glutathionhars (E1) en kobalthars (E2) tandem-affiniteit. De doorstroom (FT) van elke kolom wordt aangegeven. Paneel B: Schematische voorstelling van SLECHTE fosforylering en eiwitinteracties tijdens celoverleving en celdood (d.w.z. apoptose). Paneel C: SLECHTE eiwitsequentiedekking die geïdentificeerde Akt-consensusfosforyleringsplaatsen toont (rode doos). Paneel D: MS-spectra van stabiel isotoop-gelabeld BAD-peptide HSSYPAGTEDDEGmGEEPSPFr.

Eiwitten binden aan elkaar door een combinatie van hydrofobe binding, van der Waals-krachten en zoutbruggen op specifieke bindingsdomeinen op elk eiwit. Deze domeinen kunnen kleine bindingsspleten of grote oppervlakken zijn en kunnen slechts enkele peptiden lang zijn of honderden aminozuren omvatten. De sterkte van de binding wordt beïnvloed door de grootte van het bindingsdomein. Een voorbeeld van een gemeenschappelijk oppervlaktedomein dat stabiele eiwit-eiwit-interacties mogelijk maakt, is de leucine-ritssluiting, die bestaat uit a-helices op elk eiwit die op een parallelle manier aan elkaar binden door de hydrofobe binding van regelmatig op afstand van elkaar liggende leucineresiduen op elke α -helix die tussen de aangrenzende helixvormige peptideketens uitsteken. Vanwege de strakke moleculaire pakking zorgen leucine-ritssluitingen voor een stabiele binding voor multi-eiwitcomplexen, hoewel niet alle leucine-ritssluitingen op identieke wijze binden vanwege niet-leucine-aminozuren in de α-helix die de moleculaire pakking en daarmee de sterkte van de interactie.

Twee Src-homologie (SH)-domeinen, SH2 en SH3, zijn voorbeelden van algemene voorbijgaande bindingsdomeinen die korte peptidesequenties binden en die vaak worden aangetroffen in signaaleiwitten. Het SH2-domein herkent peptidesequenties met gefosforyleerde tyrosineresten, die vaak wijzen op eiwitactivering. SH2-domeinen spelen een sleutelrol bij de signalering van groeifactorreceptoren, waarbij ligand-gemedieerde receptorfosforylering op tyrosineresiduen stroomafwaartse effectoren rekruteert die deze residuen via hun SH2-domeinen herkennen. Het SH3-domein herkent gewoonlijk proline-rijke peptidesequenties en wordt vaak gebruikt door kinasen, fosfolipasen en GTPasen om doeleiwitten te identificeren. Hoewel zowel SH2- als SH3-domeinen in het algemeen aan deze motieven binden, wordt specificiteit voor verschillende eiwitinteracties gedicteerd door naburige aminozuurresiduen in het respectievelijke motief.

Het resultaat van twee of meer eiwitten die een interactie aangaan met een specifiek functioneel doel kan op verschillende manieren worden aangetoond. De meetbare effecten van eiwitinteracties zijn als volgt geschetst:

  • Verander de kinetische eigenschappen van enzymen, die het resultaat kunnen zijn van subtiele veranderingen in substraatbinding of allosterische effecten
  • Zorg voor substraatkanalisatie door een substraat tussen domeinen of subeenheden te verplaatsen, wat uiteindelijk resulteert in een bedoeld eindproduct
  • Creëer een nieuwe bindingsplaats, typisch voor kleine effectormoleculen
  • Een eiwit inactiveren of vernietigen
  • Verander de specificiteit van een eiwit voor zijn substraat door de interactie met verschillende bindingspartners, bijvoorbeeld een nieuwe functie aantonen die geen van beide eiwitten alleen kan vertonen
  • Een regulerende rol vervullen in een stroomopwaartse of een stroomafwaartse gebeurtenis

Meestal is een combinatie van technieken nodig om eiwitinteracties te valideren, karakteriseren en bevestigen. Eerder onbekende eiwitten kunnen worden ontdekt door hun associatie met een of meer bekende eiwitten. Analyse van eiwitinteracties kan ook unieke, onvoorziene functionele rollen voor bekende eiwitten aan het licht brengen. De ontdekking of verificatie van een interactie is de eerste stap op weg om te begrijpen waar, hoe en onder welke omstandigheden deze eiwitten interageren in vivo en de functionele implicaties van deze interacties.

While the various methods and approaches to studying protein–protein interactions are too numerous to describe here, the table below and the remainder of this section focuses on common methods to analyze protein–protein interactions and the types of interactions that can be studies using each method. In summary, stable protein–protein interactions are easiest to isolate by physical methods like co-immunoprecipitation and pull-down assays because the protein complex does not disassemble over time. Weak or transient interactions can be identified using these methods by first covalently crosslinking the proteins to freeze the interaction during the co-IP or pull-down. Alternatively, crosslinking, along with label transfer and far–western blot analysis, can be performed independent of other methods to identify protein–protein interactions.

Common methods to analyze the various types of protein interactions

MethodeProtein–protein interactions
Co-immunoprecipitation (co-IP)Stable or strong
Pull-down assayStable or strong
Crosslinking protein interaction analysisTransient or weak
Label transfer protein interaction analysisTransient or weak
Far–western blot analysisModerately stable

Co-immunoprecipitation (co-IP) is a popular technique for protein interaction discovery. Co-IP is conducted in essentially the same manner as an immunoprecipitation (IP) of a single protein, except that the target protein precipitated by the antibody, also called the "bait", is used to co-precipitate a binding partner/protein complex, or "prey", from a lysate. Essentially, the interacting protein is bound to the target antigen, which is bound by the antibody that is immobilized to the support. Immunoprecipitated proteins and their binding partners are commonly detected by sodium dodecyl sulfate–polyacrylamide gel electrophoresis (SDS-PAGE) and western blot analysis. The assumption that is usually made when associated proteins are co-precipitated is that these proteins are related to the function of the target antigen at the cellular level. This is only an assumption, however, that is subject to further verification.

Co-immunoprecipitation of cyclin B and Cdk1. The Thermo Scientific Pierce Protein A/G Magnetic Beads bind to Cdk1 antibody complexed with Cdk1. Cyclin B is bound to the Cdk1, and is captured along with its binding partner.


AlphaFold is born from deep-learning chess, Go and poker games

The success of DeepMind’s protein-folding prediction program, called AlphaFold, is not unexpected. Other deep-learning programs written by DeepMind have demolished the world’s best chess, Go and poker players.

In 2016 Stockfish-8, an open-source chess engine, was the world’s computer chess champion. It evaluated 70 million chess positions per second and had centuries of accumulated human chess strategies and decades of computer experience to draw upon. It played efficiently and brutally, mercilessly beating all its human challengers without an ounce of finesse. Enter deep learning.

On Dec. 7, 2017, Google’s deep-learning chess program AlphaZero thrashed Stockfish-8. The chess engines played 100 games, with AlphaZero winning 28 and tying 72. It didn’t lose a single game. AlphaZero did only 80,000 calculations per second, as opposed to Stockfish-8’s 70 million calculations, and it took just four hours to learn chess from scratch by playing against itself a few million times and optimizing its neural networks as it learned from its experience.

AlphaZero didn’t learn anything from humans or chess games played by humans. It taught itself and, in the process, derived strategies never seen before. In a commentary in Science magazine, former world chess champion Garry Kasparov wrote that by learning from playing itself, AlphaZero developed strategies that “reflect the truth” of chess rather than reflecting “the priorities and prejudices” of the programmers. “It’s the embodiment of the cliché ‘work smarter, not harder.’”


Eiwit vouwen

The sequence of the amino acids – which is encoded in DNA – defines the protein’s 3D shape. The shape determines its function. If the structure of the protein changes, it is unable to perform its function. Correctly predicting protein folds based on the amino acid sequence could revolutionize drug design, and explain the causes of new and old diseases.

All proteins with the same sequence of amino acid building blocks fold into the same three-dimensional form, which optimizes the interactions between the amino acids. They do this within milliseconds, although they have an astronomical number of possible configurations available to them – about 10 to the power of 300. This massive number is what makes it hard to predict how a protein folds even when scientists know the full sequence of amino acids that go into making it. Previously predicting the structure of protein from the amino acid sequence was impossible. Protein structures were experimentally determined, a time-consuming and expensive endeavor.

Once researchers can better predict how proteins fold, they’ll be able to better understand how cells function and how misfolded proteins cause disease. Better protein prediction tools will also help us design drugs that can target a particular topological region of a protein where chemical reactions take place.


Cell Biology 04: The Secretory Pathway

The secretory pathway refers to the endoplasmic reticulum, Golgi apparatus and the vesicles that travel in between them as well as the cell membrane and lysosomes. It’s named ‘secretory’ for being the pathway by which the cell secretes proteins into the extracellular environment. But as usual, etymology only tells a fraction of the story. This pathway also processes proteins that will be membrane-bound (whether in the cellular membrane or in the ER or Golgi membranes themselves), as well as lysosomal enzymes, and also any proteins that will live their lives in the secretory pathway itself. It also does some things other than process proteins.

The cytosol and the ‘lumen’ (the liquid that fills the secretory pathway) are different chemical environments, and they normally never mix. The cytosol is reductive (when you’re in the cytosol, you keep meeting molecules that want to offer you electrons), and the ER, Golgi and extracellular environment are oxidative (molecules keep coming up to you asking for electrons). See redox if still confused. This makes for different protein-folding conditions: for instance, disulfide bonds usually only form in oxidative conditions. Moreover, different proteins may live only in the secretory pathway or only in the cytosol. The secretory pathway provides a route for the cell to handle things that might not be good to have in the cytoplasm, and/or are most useful when kept concentrated in a specialized compartment with their desired interacting partners. Hepatocytes (in the liver) sequester drugs and toxins in the smooth ER and break them down for excretion from the body there. The secretory pathway is not contiguous, but every movement between its components is in little bubbled-off microcosms of its own chemical world, called vesicles.

Many proteins that go through the secretory pathway never touch the cytosol – except the parts of membrane proteins that stick out on the cytosolic side. Many of them need chaperones to help with folding, and/or a whole series of post-translational modifications in order to be ready for their native function, and the secretory pathway specializes in providing them all of that.

Today’s lecture will focus on how proteins get translated into the ER and how they travel (in vesicles) between the ER, Golgi and other destinations. This is beautifully depicted in the Life of the Cell video:

De endoplasmatisch reticulum is the first step in the secretory pathway. Its membrane is continuous with the outer nuclear membrane, though it’s not clear why that matters, since it’s not like proteins begin their life in the nucleus. Rather, mRNAs drift around in the cytoplasm until they get picked up by a ribosome interested in translating them. In ‘posttranslational translocation’ the new protein is moved into the ER after it’s translated. In the more interesting phenomenon called ‘cotranslational translocation’ the ribosome starts translation just like any other protein, but somewhere in the first 16 to 30 amino acids it hits a signal peptide (aka signal sequence). That signal’s motif is often 1 positively charged amino acid followed by 6-12 hydrophobic amino acids. This motif gets recognized by signal recognition particle (SRP, a ‘ribonucleoprotein’ or hybrid RNA/protein molecule) which binds to it and prevents the ribosome from continuing translation. Translation is stopped until the ribosome/SRP complex encounters an SRP receptor on the ER membrane. When they meet, SRP and its receptor each bind one GTP molecule in the ER membrane, which apparently strengthens their interaction. Fortuitously, this all happens adjacent to a Sec61 translocon – a protein complex that forms a channel crossing the ER membrane. The translocon is actually a complex of three different proteins (genes: SEC61A1 or SEC61A2, SEC61B, SEC61G), of which the Sec61a subunit has 10 membrane-spanning a-helices which form the channel. Once the ribosome is docked at the membrane it continues translation, pushing the signal peptide and eventually the whole protein through the channel into the ER lumen. When translation stops, SRP and SRP receptor both hydrolzye their GTP to release each other and the ribosome cargo (this has to require the energy of GTP, since the original binding was downhill), a signal peptidase cleaves the signal peptide off of the nascent protein, and the protein is free to start folding in the ER.

A couple of other players are involved for some ER proteins. Oligosaccharide transferase, which adds glycosyl groups to asparagines in the nascent protein, is part of the translocon complex and it actually performs glycosylation while the new protein is still being translated. So although we call glycosylation a ‘post-translational modification’ it is actually made during translation in this case. Also, to achieve their proper structure, some proteins need to be fully translated before they are allowed to start folding – if the N-terminal portion was allowed to start folding as soon as it entered the lumen, it would end up with the wrong overall structure. To prevent this, sometimes BiP the chaperone binds the protein to keep it unfolded for a while. Imagine BiP as another Pac-Man that bites down on the protein to keep it linear, like Hsc70 in the mitochondrial targeting process (see last week).

The first couple of minutes show the basic scenario described above. Then it moves on to a more complex scenario I’ll introduce in a minute. FYI, the video depicts two ‘controversial’ things not included in the above description: (1) the signal peptide being degraded in the membrane, and (2) a ‘plug protein’ that stops up the channel before/after translation. Not all scientists agree on these two things yet.

All of the proteins that we know go through the secretory pathway were pinpointed there by people doing localization experiments to see where in the cell a protein lies. A weird fact about the ER is that you can put the cell in a blender and afterwards the ER will just start reconnecting to itself, forming little ‘microsomes’ that are not attached to the nucleus but form contiguous bubbles of ER. You can then start to play games with proteases – which break down proteins – and detergents – which solubilize the ER membrane. Assuming your protein of interest is translated, you can check if it (1) survives protease treatment but (2) doet het niet survive protease + detergent treatment, then it’s a secretory pathway protein. The logic is that in case (1) it was protected inside the ER, but in case (2) you dissolved the ER, so it got eaten by the protease. All this assumes you have an antibody or some other way of detecting whether the protein of interest is there after these treatments.

People also used such techniques to figure out that only 70 amino acids of a new protein can be translated before it becomes too late for that protein to end up in the ER. Remember, the signal peptide is in the first 16-30 amino acids, and translocation to the ER depends on SRP being present. Ribosomes translate at a predictable rate, so people got ribosomes started on translating some mRNA and then waited set amounts of time before adding SRP, to see how much translation could occur before SRP could no longer do its job.

The SRP receptor and the Sec61 proteins are ER membrane proteins – and there many other ER membrane, Golgi membrane and lysosome membrane proteins as well. In fact, even the membrane proteins (see class 02) of the cell membrane get processed in the secretory pathway. Many of these have several or tens of transmembrane domains (20-25 hydrophobic amino acids each) that have to be inserted in the correct order and orientation (for example, you really want your ion channels and transporters pointed in the right direction, into vs. out of the cell). Accordingly there are a bunch of fancy biological mechanisms for getting these proteins inserted into the membrane correctly. This is what the latter half of the above video depicts.

So here’s a tautology: some proteins have a topogenic sequence which determines their orientation in the membrane. This sequence is made of two types of signal sequences:

  • een stop-transfer sequence (abbreviated STA for some reason) is a 22-25 hydrophobic amino acid sequence somewhere in the middle of the protein that forms an alpha helix. When encountered it gets shoved into the membrane, and then translation of the rest of the protein continues in the cytosol. So this kind of ‘undoes’ the translocation to the ER that was started by the signal peptide at the beginning (N terminus) of the protein.
  • een signal anchor sequence (abbreviated SA) is also a 22-25aa hydrophobic alpha helix, but with a series of

With those two signals as building blocks, you can imagine a protein with a series of stop transfer and signal anchor sequences to create a whole series of back and forth transmembrane domains stitched into the membrane as if by a sewing machine. People have classified the membrane proteins into five categories:

  1. Type I has just a signal peptide and then one stop transfer in the middle. Therefore it ends up with its (hydrophilic) N terminus in the lumen, its (hydrophobic) middle in the membrane and its (hydrophilic) C terminus in the cytosol.
  2. Type II does not start with a signal peptide. It starts out like any other protein, but in the middle it has a signal anchor sequence with the +++ amino acids coming first and the hydrophobic series after. This makes the protein get translocated midway through translation, with the already-translated N-terminal part sticking out into the cytosol (since the +++ have to stay cytosolic) and the now-beginning-to-be-translated C-terminal part getting translated directly into the ER. So it ends up transmembrane with its C terminus in the ER and N terminus in the cytosol – opposite of Type I.
  3. Type III is like Type II – no signal peptide, just a signal anchor in the middle, but in this case the +++ come after the hydrophobic sequence, which reverses the orientation. So this ends up with its N terminus in the ER and its C terminus in the cytosol. Opposite of Type II and, in the end, the same as Type I, though it got there in a different way – it does not have a signal peptide that gets cleaved off in the ER.
  4. Type IV or ’multipass’ proteins have an alternating series of signal sequences and stop transfer sequences. These are clearly more than one ‘type’, yet are not nearly as diverse as your combinatoric imagination might allow. The orientation of the first signal sequence determines whether the N terminus will end up in the cytosol or ER, and total number of stop transfer + signal anchor sequences determines where the C terminus will end up: an even number = same side as N terminus, odd number = opposite side as N terminus. The STA and SA sequences have to strictly alternate, with the exception that you can start with two signal anchor sequences if the first one is oriented with the N terminus into the cytosol. Just to make a mockery of this categorization scheme, people have defined some incompletely-defined subtypes of Type IV, where Type IVa is N-terminal in cytosol (thus it starts like a Type II protein) and Type IVb is N-terminal in the lumen (it starts like a Type III protein but then has another SA sequence that puts it back into the ER). GLUT1 from Class 02 is a Type IVa. -anchored proteins, which are the fifth type but aren’t called Type V, start with a signal peptide and end with a hydrophobic C-terminus which stays embedded in the membrane. That hydrophobic end gets cleaved off and replaced with GPI, which also stays embedded in the membrane. PrP is one of these – more on that later.

By now we’ve discussed how proteins can end up in the ER lumen or spanning the ER membrane. Most proteins leave the ER within minutes, transported in vesicles bound for the Golgi and then later for excretion, lysosomes or the cell membrane. That forward direction of travel is called anterograde going backwards from Golgi to ER is retrograde transport.

Both types of transport take place in membrane-bound vesicles. These bud off of the membrane of wherever they’re coming from, and later fuse to the membrane of wherever they’re headed – beautifully depicted at

2:25 in the Life of the Cell video above. The body from which the vesicles form is the ‘donor compartment’, and the destination they later fuse to is the ‘acceptor compartment’.

The budding process requires that G proteins in the membrane recruit Coat proteins. Specifically, for anterograde transport, G protein Sar1 (gene: SAR1A) recruits COPII (‘cop two’) for retrograde transport, an ARF G protein recruits COPI (pronounced ‘cop one’). These G proteins are activated to do this job when GEF loads them with GTP, swapping out GDP.

So the steps in anterograde transport, for example, are as follows:

  1. Sec12-GEF (Sec stands for secretory) loads Sar1 with GTP. When bound to GDP, Sar1 just floats around the donor compartment, but when bound to GTP, it undergoes conformational change that causes its otherwise-buried N-terminal hydrophobic tail to protrude, making it stick into the membrane, where COPII proteins then start to accumulate because they really like that tail.
  2. The COPIIs start to polymerize and, due to its conformation, have an intrinsic preference for curvature, so their accumulation starts to make budding happen. At the same time, membrane bound proteins that need to be transported – identified by a DXE (i.e. aspartate-anything-glutamate) amino acid sequence that forms a binding site in their cytosolic part – get recruited to the newly forming vesicle. Membrane-bound proteins act as receptors, recruiting lumenal proteins that are bound for the Golgi to hang out in the concave space where they’ll end up in the vesicle once it forms.
  3. Once enough COPII have arrived, the vesicle buds off, at which point Sar1 hydrolyzes its GTP, providing the energy for it to suck its hydrophobic tail back into itself, cutting the COPIIs loose. The vesicle is now disconnected from the donor compartment.
  4. Now, for poorly explained (or poorly understood?) reasons, the coat of COPIIs just disassembles, exposing receptors under the coat which direct the targeting of the vesicle. Once the vesicle arrives at its destination, Rab-GTP embedded in the vesicle membrane interacts with a Rab effector embedded in the acceptor compartment membrane. A sideways glance is exchanged, interest is kindled. Soon the vesicle will fuse to the membrane. proteins present on both the v esicle and t arget membrane (V-SNARE and T-SNARE respectively) interact to bring the membranes even closer. In this example we’ll consider VAMP (the VAMP_ genes) as the V-SNARE and Syntaxin (the STX__ genes) and SNAP25 (SNAP25 gene) as the T-SNAREs. Syntaxin and SNAP25 are both membrane proteins Syntaxin has 1 alpha helix and SNAP25 has 2, all on the cytosolic side. The alpha helices drive the interaction with VAMP. The opposing sides’ alpha helices have extremely strong affinity for one another, bringing the membranes close enough to fuse. Once this has happened, prying the V-SNAREs and T-SNAREs apart again requires two proteins: NSF (gene: NSF stands for NEM sensitive factor) and alpha-SNAP (gene: NAPA), a soluble NSF attachment protein. NSF is an ATPase, and burns ATP to drive the energetically uphill disassembly of the complex.

Now for retrograde transport. Why is there retrograde transport at all? Here is a non-exhaustive list of some reasons:

  • Some membrane proteins start their life in the ER, need to get modified in the Golgi, but then need to get back to the ER. They do this with a KKXX amino acid sequence.
  • There’s also a KDEL amino acid sequence at the C terminus of some lumenal proteins which is suppsoed to keep them in the ER, but it’s not perfect – sometimes they end up in the Golgi, in which case they’re targeted back to the ER via retrograde transport dependent on that KDEL sequence for recognition. The mechanism is kind of neat – the proteins that recognize and bind to KDEL do so only at low pH, and the pH of the Golgi is lower than the ER, so they bind KDEL in the Golgi, then release it when they’re back in the more neutral pH of the ER.
  • Also, think about it, all the proteins that participate in anterograde transport – the V-SNARES, Rab, etc. – have to get back to the ER so they can do it all over again, like how the bus has to get back to the bus depot at the end of the day.
  • As we’ll see shortly, the Golgi come in multiple stages which depend on the addition of enzymes from further downstream.

The process of retrograde transport is not so different from anterograde. It uses ARF instead of Sar1, COPI instead of COPII, but it works the same: ARF loaded with GTP lets its hydrophobic tail stick into the membrane, attracting the attention of COPIs. COPI has two components, COPIalpha and COPIbeta, both of which interact with that KKXXX sequence to recruit membrane-bound proteins destined for retrograde transport. Some proteins also have an RR sequence (anywhere in the protein) which can flag them for retrograde transport.

The Golgi apparatus is not contiguous. It is a stacked set of separate subcompartments called sacs or cisternae. Different compartments have different properties and proteins visit them in a particular order. In order from ER to cell membrane, the Golgi compartments are called cis, medial, trans and trans-Golgi network. Each compartment has different enzymes that modify proteins, and the modifications have to happen in a certain order, hence the need for a stacked set of compartments.

But as proteins mature in the Golgi, it’s not as though they bud off in vesicles from one compartment and move to the next. Rather, the compartment they are already in moves outward and ‘matures’ as new enzymes are added to it (from further down the Golgi chain) via retrograde transport. Vreemd, toch? It’s kind of like if instead of moving from an elementary school to a middle school to a high school you just stayed in one school building for your whole childhood and adolescence, and they just brought in new textbooks and teachers every year to keep it appropriate to the grade that you and your classmates had now reached. Here’s what the Golgi look like as they move and evolve:

So there’s (little or) no anterograde transport within the Golgi, but plenty of retrograde transport to bring each new round of enzymes in. When proteins have finally completed the full K-12 curriculum of the Golgi network, they do undergo transport to move on to their final destinaton. They bud off in a vesicle which will go one of three places:

    – fusion with the cell membrane. Thus the lumenal proteins will be secreted extracellularly, and the membrane proteins will become cell membrane proteins. – these just stick around as vesicles in the cell until needed – where ‘needed’ means they do eventually undergo exocytosis. In neurons, this is where neurotransmitters are stored until an action potential demands their secretion into the synapse. In the stomach, the cells that produce gastric enzymes keep those enzymes in secretory vesicles until food intake triggers their release into the stomach. - where misfolded proteins go to get degraded.

The transport from the trans-Golgi network on to these destinations is different from the other transport discussed above and often involves clathrin (CLT__ genes). Vesicles budding off have a two-layer coat, with a dapter p rotein (AP) complexes as the inner layer and clathrin as the outer layer. The adapter proteins have a target signal with a YXXh motif (h = Φ = any hydrophobic amino acid). Clathrin forms the so-called ‘clathrin-triskelion’ formation shown here:


(Image thanks to Wikimedia Commons user Phoebus87)

Clathrin is also responsible for endocytosis – budding off of vesicles of extracellular stuff (and cell membrane proteins) to come naar binnen de cel. This is called clathrin-mediated endocytosis. Receptors in the cell membrane get endocytosed very frequently: the whole population of hormone receptors turns over about every hour, especially when hormones are being received. Taking up the receptor into a vesicle is one way for the cell to cut off the incoming signal until it can be processed.
The plasma membrane notes discuss cystic fibrosis briefly: CFTR is an ABC transporter responsible for pumping Cl - out of the cell (it also lets Na + in). Loss-of-function mutants don’t pump Cl - , which removes the driving force for osmosis, thickening the mucus and causing breathing problems. There are at least 127 different loss-of-function CFTR mutants (at least, that’s how many Natera tests for) that (if both alleles are disabled) cause cystic fibrosis. The most common mutation is ΔF508, which is

3% of all European CFTR alleles and about 70% of mutant ones. The loss of that one phenylalanine changes CFTR’s conformation so that the di-acidic exit code (amino acids D565 and D567) that targets CFTR for exocytotic vesicles is no longer correctly exposed and the protein never makes it to the cell membrane [Wang 2004].

discussion section

In section we read Hu 2009, who showed that atlastin proteins are involved in creating the tubular ER network. The evidence came almost entirely from protein-protein interactions. I was surprised this paper was a big deal, because there have been a million papers showing protein-protein interactions for huntingtin, and no one really believes all of them and it hasn’t necessarily gotten us any closer to knowing what huntingtin does or what goes wrong in Huntington’s Disease. But apparently Hu was able to make a pretty clean case for the atlastins’ interactions with reticulons as implying a role in ER formation. It helps that Hu was able to show a ‘genetic interaction’ in addition to a physical (binding) interaction. A ‘genetic interaction’ (I had to look it up) means when “Sometimes mutations in two genes produce a phenotype that is surprising in light of each mutation’s individual effects. This phenomenon, which defines genetic interaction, can reveal functional relationships between genes and pathways.” [Mani 2007].

This is a decade old, so some stuff may be outdated, but I found Harris 2003 (ft)’s review of PrP cell biology extremely clear and helpful. Kim & Hegde 2002 was also helpful. PrP is a secretory pathway protein. Its first 22 amino acids (MANLGCWMLVLFVATWSDLGLC) are a signal peptide that causes cotranslational translocation to the ER. Normally, PrP just gets GPI-linked at its C terminus and is anchored to the exoplasmic side of the membrane. But amino acids 111-134 (HMAGAAAAGAVVGGLGGYMLGSAM) are a sort of weak signal anchor sequence (Type II, with the +++ amino acids coming before the signal anchor) that sometimes but not always becomes a transmembrane domain, inverting the C terminus into the lumen. Even more confusingly, that sequence can sometimes just end up as a transmembrane domain zonder the inversion, so that the N terminus is in the lumen. So there are three membrane topologies of PrP: regular old GPI-anchored, and two transmembrane orientations, as depicted in Harris 2003 Fig 3:

Note how weird Ctm PrP is. It’s transmembrane yet also GPI-anchored, and the N-terminal signal peptide is never cleaved off. Normally, the transmembrane forms are < 10% of total PrP. In some laboratory conditions the percentage is higher, and two of the GSS-causing mutations (A117V and P105L) also increase the fraction of Ctm PrP to 20-30% of all PrP. Of these three forms, there is a good amount of evidence that Ctm PrP is toxic, and that it might play a role in prion formation, though most genetic prion disease mutations (including FFI D178N) do not appear to affect the membrane topology of PrP or the fraction of Ctm PrP.

After PrP goes through the Golgi, it is targeted for the cell membrane. But according to Harris, it doesn’t just sit there – it frequently through clathrin-mediated endocytosis and cycles through the cell every

60 minutes, with some molecules being cleaved on each cycle. Copper stimulates this endocytosis of PrP. Most genetic prion disease mutations change the localization of PrP – usually when a mutation is present, less PrP is found on the cell surface, with more accumulating in the ER.

About Eric Vallabh Minikel

Eric Vallabh Minikel is on a lifelong quest to prevent prion disease. He is a scientist based at the Broad Institute of MIT and Harvard.