Informatie

Genereer mesh-oppervlak van eiwitstructuur


Welke hulpmiddelen worden het meest gebruikt voor het genereren van een mesh-oppervlak van een eiwit uit een röntgenkristallografische structuur (van het VOB)? Voors en tegens worden op prijs gesteld.

Ik heb liever dat de output een waterdicht driehoekig netwerk van het eiwitoppervlak is. Ik zou ook willen dat de tool scriptbaar is (d.w.z. het is niet nodig om een ​​GUI te openen).

Tot nu toe heb ik met MSMS en EDTSurf gespeeld. Maar ik vroeg me af wat standaard was in onderzoek, en of er iets was in de standaard bio-informaticabibliotheken.


PyMOL en Chimera kunnen dat, en beide kunnen scriptgestuurd zijn. De PyMOL-wiki staat vol met voorbeelden en heeft waarschijnlijk al een how-to waarmee u aan de slag kunt. Chimera heeft ook een volledige documentatie.


Structurele biologie van G-eiwit-gekoppelde receptoren: nieuwe kansen van XFEL's en cryoEM

Recente ontwikkelingen in cryoEM en XFEL's versnelden structurele studies van GPCR's.

XFEL's maakten schadevrije structuren bij kamertemperatuur mogelijk van kristallen van micrometerformaat.

CryoEM heeft zijn potentieel aangetoond voor het ophelderen van GPCR-signaleringscomplexen.

Zowel cryoEM als XFEL's beloven licht te werpen op de structurele dynamiek van GPCR's.

G-eiwit-gekoppelde receptoren bemiddelen celsignalering en reguleren de meeste sensorische en fysiologische processen in het menselijk lichaam. Recente doorbraken in cryo-elektronenmicroscopie en röntgenvrije elektronenlasers hebben structurele studies van moeilijk te kristalliseren receptoren en hun signaalcomplexen versneld, en hebben nieuwe mogelijkheden geopend voor het begrijpen van conformationele dynamiek en het visualiseren van het proces van receptoractivering met ongekende ruimtelijke en temporele resolutie. Hier vatten we belangrijke mijlpalen en uitdagingen samen die verband houden met de toepassing van deze technieken en schetsen we toekomstige richtingen in hun ontwikkeling met een focus op structurele biologie van membraaneiwitten.


Achtergrond

Eiwitoppervlakken trekken talrijke studies aan omdat ze de plaats zijn van moleculaire binding en enzymatische reactiviteit. Tot op heden gebruiken deze studies drie niveaus van eiwitoppervlakterepresentaties. De oudste stelt oppervlakken voor als sets van blootgestelde atomen [1]. Een veelvoorkomend alternatief is om oppervlakken weer te geven door middel van sets maaspunten [2-4] die de blootgestelde atoomoppervlakken gladmaken. Ten slotte kunnen sets mesh-punten grofkorrelig zijn door op descriptor gebaseerde methoden [5-7] die snelle vergelijkingen van oppervlakken en oppervlaktepatches mogelijk maken. Deze representaties hebben gediend als een infrastructuur voor talrijke onderzoeken die oppervlakte-elektrostatica analyseren [8, 9], katalytische residuen en actieve plaatsen voorspellen [10], en bindingsplaatsen karakteriseren voor kleine liganden en andere eiwitten (voor recente beoordelingen zie [7, 11, 12]). Hoewel deze studies een belangrijke trend in de annotatie en voorspelling van eiwitfunctie markeren, worden oppervlakken praktisch genegeerd bij de voorspelling van de eiwitstructuur. We zijn met name niet op de hoogte van enig onderzoek dat heeft geprobeerd de oppervlakken van modellen te beoordelen die zijn gegenereerd door voorspellingsmethoden. Dit is enigszins verrassend, aangezien een van de uiteindelijke doelen van structuurvoorspelling is om functionele annotatie van de doeleiwitten mogelijk te maken en om structuurgebaseerd ontwerp van liganden en mutaties te ondersteunen [13]. De huidige studie suggereert een plausibele benadering voor de beoordeling van modeloppervlakken en vergelijkt de nauwkeurigheid van het oppervlak met standaard backbone-gebaseerde metingen zoals Root Mean Square Deviation (RMSD) [14] of Global Distance Test - Total Score [15].

Ondanks het belang van de fijnkorrelige representaties van eiwitoppervlakken, vraagt ​​hun complexiteit om grove korreling, of abstractie, een grover perspectief kan nieuwe inzichten onthullen over de oppervlaktearchitectuur die anders worden gemaskeerd door de overvloed aan fijne details. Twee eerdere onderzoekslijnen, [16-18] en [19-21], suggereerden een grofkorrelige weergave van eiwitoppervlakken met behulp van het begrip oppervlaktevlekken. Hun benaderingen van het probleem waren opmerkelijk verschillend, wat de verschillende doelstellingen van deze studies weerspiegelt. Jones en Thornton [16, 17] en later Albou et al. [18] definieerde oppervlaktepleisters als overlappende sets van nabije oppervlakteresiduen, en vergeleek bindingsplaatspleisters met niet-bindende om eiwit-eiwitinteractieplaatsen te karakteriseren en te voorspellen [22]. Baldacci et al. [19, 20] definieerde oppervlaktevlakken als niet-overlappende sets van homogene en verbonden oppervlaktepunten en classificeerde ze in twaalf vooraf gedefinieerde typen. Ze gebruikten dataminingtechnieken op deze patches om structurele gelijkenis en plausibele evolutionaire verbinding tussen eiwitten te identificeren. Omdat beide toepassingen van het oppervlaktepleisterconcept zo nauw zijn afgestemd op hun specifieke doel, is het moeilijk in te zien hoe ze in een andere context kunnen worden gebruikt.

Hier presenteren we een meer algemene weergave van oppervlaktepleisters, die is geïnspireerd op de centrale rol van clustering in de studie van eiwitfragmenten (d.w.z. aaneengesloten structurele segmenten langs de eiwitketen) [23]. Representatieve fragmenten, geëxtraheerd door het clusteren van grote datasets van eiwitstructuurfragmenten, zijn gebruikt voor een breed scala aan toepassingen, waaronder: studies van sequentie/structuurrelaties [24, 25], sequentie-uitlijning [26], structurele vergelijking en classificatie [27] , grootschalige mapping van de vouwruimte van eiwitten [28], en voor voorspelling van de eiwitstructuur [26, 29]. Hier gebruiken we het K-means ++ [30] clusteringalgoritme om een ​​bibliotheek van representatieve eiwitoppervlaktepatches te genereren die vaak voorkomen in de Protein Data Bank (PDB). Om het nut van onze aanpak te demonstreren, kwantificeren we de verschillen tussen de oppervlakken van natieve eiwitstructuren en die van lokvogels die zijn gegenereerd door de modernste structuurvoorspellingsmethoden. We stellen ook een aantal andere toepassingen voor voor toekomstig onderzoek.

Kort gezegd, een oppervlaktevlek in deze studie is een set oppervlakte-atomen binnen een bepaalde straal rond een oppervlakte-β-koolstof, de spil genoemd (Figuur 1). De afstand tussen twee patches is de Root Mean Square Deviation (RMSD) tussen hun atomen onder een afbeelding die de chemische identiteit behoudt. Paren van patches met verschillende chemische samenstellingen worden als oneindig ver verwijderd beschouwd. Het K-means++-algoritme gebruikt deze afstand om een ​​grote dataset van patches op te splitsen in k = 350 structureel homogene clusters. De zwaartepunten van deze clusters vormen onze bibliotheek (Figuur 2), die echte kenmerken van oppervlakken van inheemse structuren vastlegt (Figuur 3).

Illustratie van oppervlaktepleisters geëxtraheerd uit de kristalstructuur van asparaginesynthetase (12AS). (a) De atomen van het eiwit, kleurgecodeerd door blootstelling aan oplosmiddelen van blootgesteld (rood) tot begraven (blauw). Een oppervlaktevlek bestaat uit alle blootgestelde atomen binnen een bol met straal R = 7Å (groen) rond een centraal oppervlak β-koolstof (draaipunt vergroot ter illustratie). (b) Het oppervlak van een enkele patch. (c) Naburige plekken op het eiwitoppervlak overlappen elkaar meestal (de kleine magenta bollen vertegenwoordigen draaipunten).

Bouw van de patchbibliotheek. (a) Eerst extraheren we de oppervlaktepatches uit de dataset-atomen die worden gemarkeerd door kleine bollen in de patch. (b) Vervolgens groeperen we de patches in k clusters de atomen van de patches in elke cluster zijn gesuperponeerd op het clusterzwaartepunt. Voor de duidelijkheid laten we de oppervlakken weg en geven we de atomen van elke patch in het cluster in een andere kleur. (c) De bibliotheek met oppervlaktepatches wordt weergegeven door de clustercentroïden.

De cumulatieve verdelingen van de afstand van inheemse en lokvogelplekken tot hun dichtstbijzijnde clusterzwaartepunt in de oppervlaktepatchbibliotheek. De aanpassing aan de bibliotheek van patches van native structuren (in gestippeld blauw en effen zwart) verschilt aanzienlijk van die van CASP8-servermodellen (P< 10 -42 door Wilcoxon rank sum-test).


INVOERING

Het gebied van structurele biologie is getransformeerd door frequente technologische vooruitgang voor elk aspect van de structuurbepalingspijplijn sinds de Protein Data Bank (PDB) in 1971 werd opgericht (1) als de eerste open-access digitale gegevensbron in de biologie (2) 6). Beginnend met slechts zeven eiwitstructuren, is het PDB-archief enorm gegroeid tot >145.000 structuren van eiwitten, DNA en RNA, en hun complexen met metaalionen en liganden met kleine moleculen (in totaal >1 miljard atomen).

Tegenwoordig wordt de PDB universeel beschouwd als een kernbron voor gegevenswetenschap die van fundamenteel belang is voor de bredere levenswetenschappelijke gemeenschap en voor de langetermijnbewaring van machineleesbare biologische gegevens. VOB-structuren zijn de moleculen van het leven. Kennis van 3D-structuren (vormen) van biomoleculen, hoe ze evolueren met de tijd en hoe ze in de natuur functioneren, is essentieel voor het begrijpen van kritische wetenschapsgebieden. VOB-gegevens hebben gevolgen voor fundamenteel en toegepast onderzoek naar gezondheid en ziekte van mensen, dieren en planten productie van voedsel en energie en ander onderzoek met betrekking tot mondiale welvaart en ecologische duurzaamheid ( 7). Structuurgegevens zijn ook belangrijk voor biofarmaceutische en biotechnologische bedrijven en versnellen de datagestuurde ontdekking van nieuwe medicijnen, materialen en apparaten. Tegenwoordig versnellen krachtige gepulseerde röntgenfaciliteiten, cryogene elektronenmicroscopen en nieuwe integratieve/hybride (I/H) methoden voor structuurbepaling biomedisch onderzoek met functionele inzichten in steeds complexere biologische systemen op atomair niveau. Cryo-elektronentomografie maakt het zelfs mogelijk om moleculaire machines te bestuderen die 'op heterdaad betrapt' zijn in bevroren cellen.

Sinds 1999 wordt Research Collaboratory for Structural Bioinformatics Protein Data Bank (RCSB PDB, rcsb.org) (3, 7, 8) gefinancierd door de NSF, NIH en DOE om het PDB-archief te beschermen en te onderhouden en open toegang tot PDB-gegevens te bieden . Deze blijvende toewijding weerspiegelt het cruciale belang van structuurgegevens voor fundamenteel en toegepast onderzoek in fundamentele biologie, biogeneeskunde, biotechnologie en energie. Als trouwe beheerder van PDB-gegevens heeft RCSB PDB de manier waarop de bron wordt beheerd als een wereldwijd openbaar goed getransformeerd en hoe structuurgegevens (i) deskundig worden gevalideerd en gebiocureerd wanneer ze worden bijgedragen door >30 000 PDB Gegevensdeposanten (ii) opgeslagen in een relationele database met behulp van een uitbreidbare gemeenschappelijke gegevensstandaard en (iii) verpakt en geleverd aan >1 miljoen PDB Gegevensconsumenten. Tegelijkertijd heeft RCSB PDB gelijke tred gehouden met kritische technische vooruitgang in macromoleculaire kristallografie (MX) en nucleaire magnetische spectroscopie (NMR) en de opwindende ontwikkelingen van nieuwe structuurbepalingsmethoden [seriële femtoseconde röntgenkristallografie en 3D-elektronenmicroscopie (3DEM)], terwijl het inschakelen van internationale experts en het implementeren van gemeenschapsnormen voor gegevensrepresentatie en -validatie.

VOB-gegevens behandelen belangrijke onderzoeksvragen in wetenschappelijke disciplines, variërend van landbouw tot zoölogie (9, 10). RCSB PDB levert aanzienlijke waarde aan PDB Gegevensconsumenten het verstrekken van belangrijke inzichten die veel verder gaan dan de inhoud en reikwijdte van de oorspronkelijke wetenschappelijke publicatie. De RCSB PDB-website (rcsb.org) biedt onderzoekers een one-stop-shop voor 3D-structuurgegevens. Voor elke PDB-structuur integreert RCSB PDB elke week gerelateerde gegevens van ∼ 40 externe bronnen en biedt sequentie- en 3D-structuurvisualisatietools voor onderzoekers, docenten en studenten. Deze unieke combinatie van open toegang tot primaire en geïntegreerde gegevens plus hulpmiddelen voor gegevensanalyse en structuurvisualisatie, maakt 3D-inzichten mogelijk in moleculaire structuur en functie. RCSB PDB biedt ook hulpmiddelen voor het begrijpen van verzamelingen van PDB-structuren, wat op zijn beurt de verkenning van eiwitten van verschillende organismen mogelijk maakt die de evolutie op atomair en moleculair niveau belichten. Op de educatieve website PDB-101 (pdb101.rcsb.org) biedt RCSB PDB inleidend materiaal waarin de grondbeginselen worden uitgelegd van experimentele methoden voor eiwit-, DNA- en RNA-structuren die worden gebruikt om PDB-structuren en moleculaire verhalen te genereren die de nadruk leggen op fundamentele biologie, biogeneeskunde, energie, biotechnologie en geneesmiddelen. Ontdekking. Boeiende RCSB PDB-gebruiks- en impactstatistieken onderstrepen het belang van deze bron voor wetenschap en samenleving, inclusief >110 000 individuele PDB-structuren die gegevens bijdragen aan bijna 1 miljoen wetenschappelijke publicaties (vanaf februari 2018) >1 miljoen PDB-gegevensconsumenten bediend door rcsb.org in 2017 ∼ 680 miljoen gegevensbestanden gedownload uit het VOB-archief in 2017 >620 000 VOB-gegevensconsumenten bediend door pdb101.rcsb.org in 2017 en VOB-gegevens hergebruikt door >400 externe bronnen in 2017 ( 7, 10).

Om de duurzaamheid van het PDB-archief op lange termijn te garanderen, werkte RCSB PDB in de VS in 2003 samen met lokaal gefinancierde partners in Europa (Protein Data Bank in Europe, PDBe (11)) en Azië (Protein Data Bank Japan, PDBj (12)). ) om de Worldwide Protein Data Bank te vormen (wwPDB, wwpdb.org) (2, 5). wwPDB beheert samen het archief volgens best practices, de zogenaamde KERMIS principes (staat voor) Fonhoudbaar-EENtoegankelijk-linteroperabel-Rbruikbaar ( 13)). De KERMIS principes, ontwikkeld door vertegenwoordigers van de academische wereld, de industrie, financieringsinstanties en uitgeverijen, bieden richtlijnen voor gegevensopslagplaatsen om gebruikers en hergebruik van gegevens zo goed mogelijk te ondersteunen. De oprichting van de wwPDB heeft ervoor gezorgd dat onderzoekers, docenten en studenten over de hele wereld open toegang hebben tot 's werelds structuurgegevens volgens deze richtlijnen. De vorming van de wwPDB heeft ook een rechtvaardige verdeling van de kosten voor de archivering en het beheer van PDB-gegevens tussen de VS, Europa en Azië mogelijk gemaakt.

Sinds onze laatste Onderzoek naar nucleïnezuren Database Issue-publicatie ( 8), RCSB PDB-activiteiten zijn gereorganiseerd in vier geïntegreerde, onderling afhankelijke cyberinfrastructuurdiensten, RCSB PDB-hardware en -software zijn geüpgraded en nieuwe tools en bronnen zijn geïntroduceerd.


De recente beschikbaarheid van röntgenstructuren voor diverse ligandgebonden Family AG-eiwitgekoppelde receptoren (GPCR's) in meerdere conformaties (inactieve vorm met een antagonist/inverse agonist gebonden en actieve vorm met een agonist gebonden) maakt nu rationele inspanningen voor het ontwerpen van geneesmiddelen mogelijk die zijn van oudsher toegepast op oplosbare enzymdoelen. Hier beoordelen we de eigenschappen van deze GPCR-bindingsplaatsen, met behulp van een unieke combinatie van berekende fysisch-chemische eigenschappen en waterenergetica (GRID, WaterMap en SZMAP) om een ​​nieuw perspectief en een rationele beoordeling van de geschiktheid van geneesmiddelen voor elke GPCR-doelbindingsplaats te bieden. Er worden voorbeelden beschreven van verschillende goed bestudeerde enzymsystemen ter ondersteuning van deze geavanceerde, op structuur gebaseerde benadering voor het beoordelen van de geschiktheid van geneesmiddelen en om hun eigenschappen te contrasteren met die van GPCR's. Veranderingen in receptorconformaties tussen de inactieve en actieve GPCR-vormen die uit de eiwitstructuren blijken, worden besproken, wat belangrijke aanwijzingen oplevert voor een rationeel geneesmiddelontwerp van antagonisten en agonisten en een beter begrip van GPCR-activering.

Deze auteurs hebben in gelijke mate bijgedragen aan dit artikel.


Oplossing?

Om dit probleem op te lossen, genereert HOLLOW een oppervlak uit een "afgietsel" van het eiwitoppervlak. HOLLOW vult de binnenruimten van een eiwitstructuur met dummy-atomen gedefinieerd op een overlappend raster. Aangetoond kan worden dat het oppervlak dat door deze dummy-atomen wordt gegenereerd, het oppervlak van het eiwit op de ideale limiet reproduceert.

Door het oppervlak van de dummy-atomen te gebruiken, kunnen we ons concentreren op een specifiek stuk van het binnenoppervlak. Door simpelweg dummy-atomen te verwijderen, kan het binnenoppervlak worden bijgesneden om een ​​aangepast deel van de binnenruimte te creëren.

Het aangepaste gedeelte van de ruimte kan worden gebruikt om binnenoppervlakken te genereren, zoals dit kanaaloppervlak van het ammoniakkanaal. Voor geavanceerde kleuring van het oppervlak kan de B-factor van de dummy-atomen worden berekend als het gemiddelde van de B-factor van de eiwitatomen die de dummy-atomen omringen. Hierdoor kunnen verschillende kleuringen van het oppervlak door het B-factorveld van de PDB-bestanden worden overgebracht.


Hoogtepunten

Van fasescheiding is bekend dat het een rol speelt in een verscheidenheid aan cellulaire processen, waaronder de vorming van klassieke membraanloze organellen, signaalcomplexen, het cytoskelet en tal van andere supramoleculaire assemblages.

Het concept van fasescheiding biedt een nieuw raamwerk voor ons begrip van de functionele rol van sequentiedegeneratie (lage complexiteit) en eiwitstoornis.

Accumulerend bewijsmateriaal wijst op een sleutelrol voor faseovergangen bij ziekten bij de mens die verband houden met eiwitaggregatie, en op de verkeerde regulatie van membraanloze organellen bij ziekten.

Het begrijpen van de fysische principes en moleculaire interacties achter eiwitfasescheiding zou nieuwe biomaterialen kunnen inspireren.

Cellulaire compartimenten en organellen organiseren biologische materie. De meeste bekende organellen worden door een membraangrens gescheiden van hun omgeving. Er zijn ook veel zogenaamde membraanloze organellen en recente studies suggereren dat deze organellen, die supramoleculaire samenstellingen van eiwitten en RNA-moleculen zijn, zich vormen via eiwitfasescheiding. Recente ontdekkingen hebben licht geworpen op de moleculaire eigenschappen, vorming, regulatie en functie van membraanloze organellen. Een combinatie van technieken uit de celbiologie, biofysica, fysische chemie, structurele biologie en bio-informatica beginnen de moleculaire principes van een opkomend veld te helpen vaststellen, waardoor de weg wordt vrijgemaakt voor opwindende ontdekkingen, waaronder nieuwe therapeutische benaderingen voor de behandeling van leeftijdsgebonden aandoeningen.


Ondersteunende informatie

S1 Fig. Verdeling van 3DZD-afstanden van eiwitparen uit verschillende vouwklassen in de eiwitdataset met enkele keten.

Bovenaan het histogram van de 3DZD-afstanden van eiwitten uit verschillende combinaties van vouwklassen. Fold-klasse-informatie werd verkregen uit de CATH-database. De y-as toont het aantal paren dat in elke afstandsbak valt. Er worden twee pieken waargenomen voor paren die betrekking hebben op de weinige secundaire structuur (ss) klasse. Er zijn slechts 28 kettingen in de weinige ss-klasse. Die kettingen hebben ruwweg twee soorten vormen, ofwel langwerpig, ofwel relatief bolvormig. De piek op relatief kleine afstand komt overeen met paren binnen elke categorie, terwijl de piek op relatief grote afstand overeenkomt met paren over twee categorieën. Onderaan de 3DZD-afstandsverdeling van maximaal een bak van 4,0-5,0. De y-as is nu het werkelijke aantal eiwitparen.

S2 Fig. Histogrammen van excentriciteit van de enkelketenige en complexe datasets.

De blauwe lijn is voor de eiwitdataset met één keten, terwijl de oranje lijn voor de complexe dataset is.

S3 Fig. Vergelijking tussen 3DZD en de Procrustes-afstand.

(A), Vergelijking van de Euclidische afstand van 3DZD en de Procrustes-afstand voor alle paren van 20 ellipsoïden met toenemende excentriciteitswaarden van 0,0 tot 0,92. Op elke ellipsoïde werden 2500 punten uniform bemonsterd op de bolcoördinaten. De twee hoeken, θ (0 tot ) en φ (0 tot 2π) werden gelijkmatig verdeeld in 50 intervallen en voor elke combinatie van θ en φ werd een punt op het ellipsoïde oppervlak geplaatst. (B), de 3DZD- en de Procrustes-afstanden werden vergeleken voor 1.278 enkelketenige eiwitparen die hetzelfde aantal hoekpunten hebben in de weergave van de oppervlaktedriehoek. Voor het berekenen van de Procrustes-afstand voor een eiwitpaar, werden de dichtstbijzijnde oppervlaktepuntparen van de twee eiwitten gematcht met behulp van het coherente puntontwerp-algoritme. (C), een voorbeeld van eiwitparen met een grote 3DZD-afstand en een kleine Procrustes-afstand. 2bwrA (CATH-code: N/A) en 3ke3A (CATH: 3.40.640.10, 3.90.1150.10, er zijn twee CATH-codes omdat dit een structuur met twee domeinen is). De 3DZD-afstand: 13,88 de Procrustes-afstand: 0,19. (D), nog zo'n voorbeeld van eiwitparen. 4gnrA (CATH: 3.40.50.2300, 3.40.50.2300) en 3ga7A (CATH: 3.40.50.1820). De 3DZD-afstand: 13,13 de Procrustes-afstand: 0,18.

S4 Fig. Vergelijking tussen 3DZD en de TM-score op de dataset met één keten.

(A), elk punt vertegenwoordigt een eiwitpaar. (B), dezelfde gegevens worden weergegeven met de dichtheidsinformatie. (C), een voorbeeld van eiwitparen met een kleine 3DZD Euclidische afstand maar van verschillende vouwklassen, de α-klasse en de β-klasse. Links, VOB ID: 1c3cA CATH-code: 1.10.276.10. Rechts, 4jp0A, 2.80.10.50. De Euclidische afstand van 3DZD was 2,4, terwijl de TM-score 0,265 was. (D), een ander voorbeeld van eiwitparen met een kleine 3DZD Euclidische afstand maar van verschillende vouwklassen, de β-klasse en de αβ-klasse. Links, 3a6rA 2.30.110.10. Rechts, 3h87A, 3.40.50.1010. De Euclidische afstand van 3DZD was 2,4, terwijl de TM-score 0,254 was.

S5 Fig. Scree-plots van enkelketenige en complexe datasets.

De figuur toont de top 10 eigenwaarden van de covariantiematrix gesorteerd in aflopende volgorde. De insert toont alle 121 eigenwaarden. Eigenwaarden van single-chain, high-coverage single-chain en complexe datasets zijn respectievelijk rood, oranje en blauw gekleurd. De scherpe daling tot de derde eigenwaarde geeft aan dat het toevoegen van een vierde en meer eigenwaarden niet substantieel meer informatie toevoegt.

S1-gegevens. Een zip-bestand van 3DZD-bestanden van de single-chain en complexe datasets.

S1 Film. Overzicht van de 3D-vormruimte van enkelketenige eiwitten.

Hetzelfde als de voorstellingen die in Fig. 1 worden gebruikt, komt elk punt overeen met een eiwit. De puntkleur geeft de excentriciteit aan van blauw naar rood voor 0,0 (bol) tot 1,0 (langwerpige vorm). De eerste, tweede en derde as worden respectievelijk in zwart, groen en oranje weergegeven. Oriëntaties van de vormruimte getoond in deze film zijn in de volgende volgorde: Fig 1A -> xy vlak van z(+) -> xz vlak van y(+) -> Fig 1D -> xz vlak van y(-) -> Fig 1A -> Fig 2A -> Fig 1A.

S2 Film. Overzicht van de 3D-vormruimte van complexen.

Hetzelfde als de representaties die in figuur 6 zijn aangenomen, komt elk punt overeen met een complex. De puntkleur geeft de excentriciteit aan van blauw naar rood voor 0,0 (bol) tot 1,0 (langwerpige vorm). De eerste, tweede en derde as worden respectievelijk in zwart, groen en oranje weergegeven. Oriëntaties van de vormruimte getoond in deze film zijn in de volgende volgorde: Fig 6A -> Fig 6C -> x-y vlak van z(+) -> x-z vlak van y(+) -> Fig 6D -> Fig 6A.

S1 Pymol-bestand. De 3D-vormruimte van enkelketenige eiwitten getoond in de moleculaire visualisatiesoftware Pymol.

Pymol is een 3D-viewer voor biomoleculaire structuren en is gratis beschikbaar op https://pymol.org/2/. Lezers kunnen de Pymol-software downloaden en het sessiebestand openen in Pymol om de vormruimte in 3D te roteren. Hetzelfde als Fig 1 en S1 Movie, wordt elk eiwit met een enkele keten weergegeven als een punt dat wordt gekleurd door de excentriciteitswaarde.

S2 Pymol-bestand. De verdeling van het aantal domeinen in de vormruimte met één keten weergegeven in de moleculaire visualisatiesoftware Pymol.

De kleuring van de punten volgt hetzelfde patroon als in figuur 4A en 4B. Rood, geel, groen, cyaan, blauw, roze en paars komen respectievelijk overeen met 1, 2, 3, 4, 5, 6, 8 domeinen.

S3 Pymol-bestand. De verdeling van de ketenlengtes in de vormruimte met één keten weergegeven in de moleculaire visualisatiesoftware Pymol.

De kleuring van de punten volgt hetzelfde patroon als in figuur 4C en 4D. De kleurcode die varieert van paars tot groen geeft de lengte (d.w.z. het aantal aminozuren) in eiwitten weer van kort tot lang. De lengtes zijn ingedeeld in twaalf bakken, 40-140, 140-240, enzovoort tot 1140-1540.

S4 Pymol-bestand. De 3D-vormruimte van complexen getoond in de moleculaire visualisatiesoftware Pymol.

De kleurcode is dezelfde als die in Fig 6 en S2 Movie. Elk complex wordt weergegeven als een punt gekleurd door de excentriciteitswaarde.

S5 Pymol-bestand. Superpositie van de enkele-keten en complexe eiwitvormruimten getoond in de moleculaire visualisatiesoftware Pymol.

Rode punten vertegenwoordigen eiwitten met een enkele keten. Blauwe punten vertegenwoordigen complexen. Dit bestand komt overeen met figuur 7.

S6 Pymol-bestand. De structurele symmetrie van eiwitcomplexen getoond in de moleculaire visualisatiesoftware Pymol.

De kleurcode is dezelfde als die gebruikt in figuur 8. Asymmetrische structuren, wit C2, rood C3, geel C4-C5, groen C6-C15, cyaan. Alle tweevlaks symmetrieën (D2-D7) zijn blauw gekleurd. Tetraëdrische en octaëdrische, paarse icosaëdrische, oranje en spiraalvormige, zwart. De straal van bollen weerspiegelt het symmetriegetal met een grotere straal dat wordt gebruikt voor structuren met een groter aantal.


Hemoglobine is een in water oplosbaar bolvormig eiwit dat is samengesteld uit twee α-polypeptideketens, twee β-polypeptideketens en een anorganische prosthetische haemgroep. Zijn functie is om zuurstof door het bloed te vervoeren, en wordt daarbij vergemakkelijkt door de aanwezigheid van de haemgroep die een ( ekst bevat)^<2+>) ion, waaraan de zuurstofmoleculen kunnen binden.

collageen is een vezelig eiwit dat bestaat uit drie polypeptideketens die om elkaar heen zijn gewikkeld. Elk van de drie kettingen is zelf een spoel. Tussen deze spiralen, die ongeveer 1000 aminozuren lang zijn, vormen zich waterstofbruggen, wat de structuur kracht geeft. Dit is belangrijk gezien de rol van collageen, als structureel eiwit. Deze sterkte wordt vergroot door het feit dat collageenmoleculen verdere ketens vormen met andere collageenmoleculen en vormen Covalente kruisverbindingen met elkaar, die versprongen langs de moleculen zijn om de stabiliteit verder te vergroten. Collageenmoleculen die om elkaar heen zijn gewikkeld vormen collageen fibrillen die zelf vormen collageen vezels.


Aminozuren

Eiwitten zijn een van de meest voorkomende organische moleculen in levende systemen en hebben de meest uiteenlopende functies van alle macromoleculen. Eiwitten kunnen structureel, regulerend, contractiel of beschermend zijn, ze kunnen dienen bij transport, opslag of membranen of ze kunnen toxines of enzymen zijn. Elke cel in een levend systeem kan duizenden eiwitten bevatten, elk met een unieke functie. Hun structuren, evenals hun functies, variëren sterk. Het zijn echter allemaal polymeren van aminozuren, gerangschikt in een lineaire volgorde.

Figuur 1. Aminozuren hebben een centraal asymmetrisch koolstofatoom waaraan een aminogroep, een carboxylgroep, een waterstofatoom en een zijketen (R-groep) zijn bevestigd.

Aminozuren zijn de monomeren waaruit eiwitten zijn opgebouwd. Elk aminozuur heeft dezelfde fundamentele structuur, die bestaat uit een centraal koolstofatoom, ook bekend als de alfa (α) koolstof, gebonden aan een aminogroep (NH2), een carboxylgroep (COOH) en aan een waterstofatoom. Elk aminozuur heeft ook een ander atoom of een groep atomen gebonden aan het centrale atoom dat bekend staat als de R-groep (Figuur 1).

De naam '8220aminozuur'8221 is afgeleid van het feit dat ze zowel de aminogroep als de carboxylzuurgroep in hun basisstructuur bevatten. Zoals gezegd zijn er 20 aminozuren aanwezig in eiwitten. Tien hiervan worden bij de mens als essentiële aminozuren beschouwd omdat het menselijk lichaam ze niet kan produceren en ze uit de voeding worden gehaald.

Voor elk aminozuur is de R-groep (of zijketen) anders (Figuur 2).

Oefenvraag

Figuur 2. Er zijn 20 veelvoorkomende aminozuren die vaak worden aangetroffen in eiwitten, elk met een andere R-groep (variantgroep) die de chemische aard ervan bepaalt.

Welke categorieën aminozuren zou je verwachten te vinden op het oppervlak van een oplosbaar eiwit, en welke zou je verwachten te vinden in het binnenste? Welke verdeling van aminozuren zou je verwachten te vinden in een eiwit dat is ingebed in een lipidedubbellaag?

De chemische aard van de zijketen bepaalt de aard van het aminozuur (dat wil zeggen, of het zuur, basisch, polair of niet-polair is). Het aminozuur glycine heeft bijvoorbeeld een waterstofatoom als de R-groep. Aminozuren zoals valine, methionine en alanine zijn niet-polair of hydrofoob van aard, terwijl aminozuren zoals serine, threonine en cysteïne polair zijn en hydrofiele zijketens hebben. De zijketens van lysine en arginine zijn positief geladen en daarom worden deze aminozuren ook wel basische aminozuren genoemd. Proline heeft een R-groep die is gekoppeld aan de aminogroep en een ringachtige structuur vormt. Proline is een uitzondering op de standaardstructuur van een animozuur omdat de aminogroep niet gescheiden is van de zijketen (Figuur 2).

Aminozuren worden weergegeven door een enkele hoofdletter of een afkorting van drie letters. Valine is bijvoorbeeld bekend onder de letter V of het drieletterige symbool val. Net zoals sommige vetzuren essentieel zijn voor een dieet, zijn sommige aminozuren ook noodzakelijk. Ze staan ​​bekend als essentiële aminozuren en bij mensen omvatten ze isoleucine, leucine en cysteïne. Essentiële aminozuren verwijzen naar die welke nodig zijn voor de opbouw van eiwitten in het lichaam, hoewel ze niet door het lichaam worden geproduceerd, welke aminozuren essentieel zijn, verschilt van organisme tot organisme.

Figuur 3. De vorming van peptidebindingen is een dehydratatiesynthesereactie. De carboxylgroep van één aminozuur is gekoppeld aan de aminogroep van het binnenkomende aminozuur. Daarbij komt een watermolecuul vrij.

De volgorde en het aantal aminozuren bepalen uiteindelijk de vorm, grootte en functie van het eiwit. Elk aminozuur is aan een ander aminozuur gebonden door een covalente binding, bekend als een peptidebinding, die wordt gevormd door een dehydratatiereactie. De carboxylgroep van één aminozuur en de aminogroep van het binnenkomende aminozuur combineren, waardoor een watermolecuul vrijkomt. De resulterende binding is de peptidebinding (Figuur 3).

De producten die door dergelijke koppelingen worden gevormd, worden peptiden genoemd. Naarmate meer aminozuren zich bij deze groeiende keten voegen, staat de resulterende keten bekend als een polypeptide. Elk polypeptide heeft aan één uiteinde een vrije aminogroep. Dit uiteinde wordt het N-uiteinde of het amino-uiteinde genoemd en het andere uiteinde heeft een vrije carboxylgroep, ook bekend als het C- of carboxyl-uiteinde. Hoewel de termen polypeptide en eiwit soms door elkaar worden gebruikt, is een polypeptide technisch gezien een polymeer van aminozuren, terwijl de term eiwit wordt gebruikt voor een polypeptide of polypeptiden die zijn gecombineerd, vaak gebonden niet-peptide prosthetische groepen hebben, een verschillende vorm hebben , en hebben een unieke functie. Na eiwitsynthese (vertaling) worden de meeste eiwitten gemodificeerd. Deze staan ​​bekend als post-translationele modificaties. Ze kunnen splitsing, fosforylering ondergaan of de toevoeging van andere chemische groepen vereisen. Pas na deze aanpassingen is het eiwit volledig functioneel.

De evolutionaire betekenis van cytochroom c

Cytochroom c is een belangrijk onderdeel van de elektronentransportketen, een onderdeel van de cellulaire ademhaling, en wordt normaal gesproken aangetroffen in het cellulaire organel, het mitochondrion. Dit eiwit heeft een heem-prothetische groep en het centrale ion van het heem wordt afwisselend gereduceerd en geoxideerd tijdens elektronenoverdracht. Omdat de rol van dit essentiële eiwit bij het produceren van cellulaire energie cruciaal is, is het in de loop van miljoenen jaren weinig veranderd. Eiwitsequencing heeft aangetoond dat er een aanzienlijke hoeveelheid cytochroom c aminozuursequentiehomologie is tussen verschillende soorten, met andere woorden, evolutionaire verwantschap kan worden beoordeeld door de overeenkomsten of verschillen tussen de DNA- of eiwitsequenties van verschillende soorten te meten.

Wetenschappers hebben vastgesteld dat menselijk cytochroom c 104 aminozuren bevat. Voor elk cytochroom c-molecuul van verschillende organismen waarvan tot nu toe de sequentie is bepaald, verschijnen 37 van deze aminozuren op dezelfde positie in alle monsters van cytochroom c. Dit geeft aan dat er mogelijk een gemeenschappelijke voorouder is geweest. Bij het vergelijken van de eiwitsequenties van de mens en de chimpansee werd geen sequentieverschil gevonden. Toen de sequenties van mens en resusaap werden vergeleken, was het enige verschil dat werd gevonden in één aminozuur. In een andere vergelijking laat sequencing van mens tot gist een verschil zien op de 44e positie.


Ondersteunende informatie

S1 Fig. Drie verschillende NTD M1-interfaces onthuld door eerdere röntgenkristallografie.

Getoond worden waargenomen (A) C2-symmetrie-interface, aanwezig in structuur VOB: 1AA7 [14], en (B) gestapelde en (C) laterale interfaces aanwezig in structuur VOB: 1EA3 [15]. Lysine-residuen, die hieronder worden gebruikt bij verknopingsanalyses, worden in rood weergegeven. Hypothetische locaties van CTD's worden groen weergegeven. CTD, C-terminaal domein M1, matrixeiwit 1 NTD, N-terminaal domein PDB, Protein Data Bank

S2 Fig. Cryo-EM van WT-M1-eiwitoligomeren.

(A) representatieve cryo-EM-microfoto van WT-M1-oligomeren. (B) Fourier-transformatie van de afbeelding in (A) toont laaglijnen. De eerste laaglijn geeft de 111-Å-spiraalvormige spoed van het WT-M1-oligomeer aan. (C) 2D-klassegemiddelden die zich richten op het midden van de spiraalvormige segmenten vertonen een grote heterogeniteit van extra dichtheid aan weerszijden van de buitenste laag van het filament. cryo-EM, cryo-elektronenmicroscopie M1, matrixeiwit 1 WT-M1, PR8 M1 van volledige lengte.

S3 Fig. M1 assembly is dependent on time as well as protein and NaCl concentration.

Negative-stain electron micrographs (A) after 2 h and (B) 24 h of incubation at the indicated concentrations of protein in the presence of 2 M NaCl. (C) Negative-stain electron micrographs following 24-h incubations of 10.8 μM M1 assembled at NaCl concentrations indicated. Scale bar = 5,000 Å. M1, matrix protein 1

S4 Fig. Cryo-EM helical reconstruction of M1-V97K filaments.

(A) Fourier transform of a representative micrograph that shows the water ring. (B) Layer line indexing. (C) Representative 2D class averages. (D) Local resolution of the M1-V97K asymmetric unit. (E) FSC curve shows 3.4 Å resolution using the 0.143 cutoff. cryo-EM, cryo-electron microscopy FSC, Fourier shell correlation M1, matrix protein 1

S5 Fig. Discovered crosslinks map well to the M1-V97K structure.

(A) Ribbon representation of one M1-V97K protein in the same orientations as shown in Fig 5, displaying the discovered crosslinks applying the same color scheme as in Fig 4. Lysine residues are shown as orange sticks. (B) Same as in (A), except only green and red crosslinks are displayed to highlight crosslinks formed by lysine K242 and K252, located on flexible loop L12. M1, matrix protein 1

S6 Fig. M1-V97K cryo-EM structure reveals molecular interactions between adjacent monomers.

(A) A group of 6 asymmetric units with the lower strand identified as N (pink), N + 1 (red), and N + 2 (cyan) and the upper strand identified as N + 22 (green), N + 23 (yellow), and N + 24 (blue). Dotted circles highlight 3 groups of intermolecular interactions. (B) Interactions between N CTD and N + 23 NTD at the interstrand interface. Five residues T167–169, N170, and R174 from N participate in a hydrophobic pocket that also contains Q75 from N + 23. (C) Interactions between NTDs of 2 adjacent asymmetric units N + 23 and N + 24. Residues L3, L4, T140, and F144 from N + 24 form a hydrophobic pocket with I51 from N + 23. (D) Connecting loop CL9 and helix α10 from the CTD of N + 23 interact with N + 24 NTD via hydrogen bonds and hydrophobic interactions. (E) Helices α11 and α12 from the CTD of N + 23 interact with N + 24 via hydrogen bonds, salt bridges, and hydrophobic interactions. Yellow dashed lines indicate hydrogen bonds and salt bridges. Orientations are altered to facilitate visualization. CL, connecting loop cryo-EM, cryo-electron microscopy CTD, C-terminal domain M1, matrix protein 1 NTD, N-terminal domain.

S7 Fig. Mutations of WT-M1 mapped onto the M1-V97K structure.

All residues mutated in the WT-M1 background are displayed as spheres in the context of the M1-V97K oligomer. Mutated residues that resulted in single-layered, no apparent, or multilayered oligomerization are displayed as red, blue, and orange spheres, respectively. Residue I51, at which mutations resulted in no apparent or multilayered oligomerization, is displayed in green. M1, matrix protein 1 WT-M1, full-length PR8 M1.

S8 Fig. Angles between stacked interfaces.

Comparison of the stacked interface between 2 subunits (gray) of the crystal structure of NTD M1 (PDB: 1EA3) [15] and the NTDs of 2 M1 subunits, N + 23 (yellow) and N + 24 (blue), of the cryo-EM structure of M1-V97K oligomers. The lack of superposition of the yellow and leftmost gray subunit reveals the slight alteration in the stacked interface between the NTD and full-length M1 structures. cryo-EM, cryo-electron microscopy M1, matrix protein 1 NTD, N-terminal domain PDB, Protein Data Bank

S9 Fig. Amino acid conservation between 3,544 IAV M1s.

Amino acids are shown with each residue colored by its conservation score, as calculated using the ConSurf server. M1, matrix protein 1

S10 Fig. Orientation and dimensions of 1 monomeric subunit within the M1-V97K filament.

Shown are 3 adjacent subunits within the M1-V97K tube with the stacked interface between M1 monomers indicated. A box highlights the length and width of the yellow subunit. The NTD is pointed towards the outside of the tube. M1, matrix protein 1 NTD, N-terminal domain.

S11 Fig. pH sensitivity of WT-M1 and V97K-M1 oligomers.

(A) Negative-stain electron micrographs of WT-M1 (left) and V97K-M1 (right) oligomers that were pelleted and resuspended in buffer at pH 7 or 5.5 as indicated. (B) SDS-PAGE quantification of pellets (P) and supernatants (S) after resuspending WT-M1 and M1-V97K oligomers in buffer at pH 7 or 5.5. M1, matrix protein 1 WT-M1, full-length PR8 M1.

S1 Table. Protein–protein interfaces and crystallization conditions of all IAV NTD M1 structures deposited to the PDB at rcsb.org.

IAV, influenza A virus M1, matrix protein 1 NTD, N-terminal domain PDB, Protein Data Bank

S2 Tafel. Related to Fig 3.

Mutations at the stacked, lateral, and C2-dimer interface.

S3 Table. Related to Fig 5.

Cryo-EM data collection, processing, and model refinement statistics of the WT-M1 and M1-V97K M1 filaments. cryo-EM, cryo-electron microscopy M1, matrix protein 1 WT-M1, full-length PR8 M1.

S1 Movie. Related to Fig 6.

M1 subunit interactions within the M1-V97K oligomer. M1, matrix protein 1

S1 Data. Related to Fig 4.

Raw MS data for M1 from M1-V97K oligomers. MS, mass spectrometry M1, matrix protein 1

S2 Data. Related to Fig 4.

Raw MS data for M1 from WT-M1 oligomers. MS, mass spectrometry M1, matrix protein 1 WT-M1, full-length PR8 M1.

S3 Data. Related to Fig 4.

Raw MS data for M1 from PR8 virions at pH 7. MS, mass spectrometry M1, matrix protein 1 PR8, A/Puerto Rico/8/1934(H1N1)

S4 Data. Related to Fig 4.

Raw MS data for M1 from PR8 virions at pH 5.5. MS, mass spectrometry M1, matrix protein 1 PR8, A/Puerto Rico/8/1934(H1N1)

S5 Data. Related to Fig 4.

Raw MS data for M1 from Udorn virions at pH 7. MS, mass spectrometry M1, matrix protein 1 Udorn, A/Udorn/1972(H3N2) filamentous virus

S6 Data. Related to Fig 4.

Raw MS data for M1 from Udorn virions at pH 5.5. MS, mass spectrometry M1, matrix protein 1 Udorn, A/Udorn/1972(H3N2) filamentous virus

S1 Raw Images.


Bekijk de video: Kokius maisto papildus pasirinkti (November 2021).