Informatie

Het MOI schatten voor een complex celtype?


Ik ben momenteel in de war over de schatting van multipliciteit van infectie (MOI), hier is een voorbeeld in een wetenschappelijk artikel

in figuur 3b hebben ze het virus getest en op basis hiervan krijgen ze een geschatte MOI:

Om de MOI te schatten, isoleerden we in totaal 45 individuele neuronen van drie dieren die met MAPseq-virus waren geïnjecteerd in de juiste LC en hebben we de streepjescodes in elk neuron gesequenced. Gemiddeld bevatten geïnfecteerde LC-neuronen elk 1,2 ± 0,1 streepjescodes, wat een MOI van 0,43 impliceert (Figuur 3B).

Ik ben in de war welke vergelijking ze hebben gebruikt voor het schatten?

Bij voorbaat dank!


Een nieuwe virtuele screeningprocedure identificeert pralatrexaat als remmer van SARS-CoV-2 RdRp en vermindert de virale replicatie in vitro

Affiliation Center for High Performance Computing, Joint Engineering Research Center for Health Big Data Intelligent Analysis Technology, Shenzhen Institutes of Advanced Technology, Chinese Academy of Sciences, Shenzhen, Guangdong, China

Gelijkelijk bijgedragen aan dit werk met: Haiping Zhang, Yang Yang, Junxin Li

Rollen Financiering acquisitie, Onderzoek, Methodologie, Projectadministratie, Validatie, Schrijven – origineel concept, Schrijven – review & redactie

Affiliatie Shenzhen Key Laboratory of Pathogen and Immunity, National Clinical Research Center for besmettelijk disease, State Key Discipline of Infectious Disease, Shenzhen Third People's Hospital, Second Hospital aangesloten bij Southern University of Science and Technology, Shenzhen, China

Gelijkelijk bijgedragen aan dit werk met: Haiping Zhang, Yang Yang, Junxin Li

Rollen Financiering acquisitie, middelen, visualisatie, schrijven – review & redactie

Affiliatie Shenzhen Laboratory of Human Antibody Engineering, Institute of Biomedicine and Biotechnology, Shenzhen Institutes of Advanced Technology, Chinese Academie van Wetenschappen, Universiteitsstad Shenzhen, Shenzhen, China

Rollen Datacuratie, Formele analyse, Onderzoek, Validatie, Schrijven – origineel concept

Affiliatie CAS Key Laboratory of Pathogene Microbiology and Immunology, Institute of Microbiology, Chinese Academy of Sciences, Beijing, China

Rollenonderzoek, schrijven - origineel ontwerp

Affiliation Center for High Performance Computing, Joint Engineering Research Center for Health Big Data Intelligent Analysis Technology, Shenzhen Institutes of Advanced Technology, Chinese Academy of Sciences, Shenzhen, Guangdong, China

Rollen Onderzoek, Supervisie, Schrijven – review & redactie

Affiliatie Shenzhen Key Laboratory of Pathogen and Immunity, National Clinical Research Center for besmettelijk disease, State Key Discipline of Infectious Disease, Shenzhen Third People's Hospital, Second Hospital aangesloten bij Southern University of Science and Technology, Shenzhen, China

Rollenonderzoek, methodologie, schrijven - origineel ontwerp

Affiliation School of Biological Sciences, Nanyang Technological University, Singapore, Singapore

Rollenonderzoek, bronnen, schrijven - origineel ontwerp

Affiliations Center for High Performance Computing, Joint Engineering Research Center for Health Big Data Intelligent Analysis Technology, Shenzhen Institutes of Advanced Technology, Chinese Academy of Sciences, Shenzhen, Guangdong, China, University of Chinese Academy of Sciences, Shijingshan District, Beijing, China

Rollenonderzoek, schrijven - origineel ontwerp

Affiliatie Shenzhen Laboratory of Human Antibody Engineering, Institute of Biomedicine and Biotechnology, Shenzhen Institutes of Advanced Technology, Chinese Academie van Wetenschappen, Universiteitsstad Shenzhen, Shenzhen, China

Rollen Onderzoek, Schrijven – review & redactie

Affiliation Center for High Performance Computing, Joint Engineering Research Center for Health Big Data Intelligent Analysis Technology, Shenzhen Institutes of Advanced Technology, Chinese Academy of Sciences, Shenzhen, Guangdong, China

Rollen Formele analyse, Onderzoek

Affiliation Institute of Toxicology, Shenzhen Center for Disease Control and Prevention, Shenzhen, China

Rollen Conceptualisering, Onderzoek, Methodologie, Supervisie, Schrijven – review & redactie

Afdeling Computerwetenschappen, Georgia State University, Atlanta, Georgia, Verenigde Staten van Amerika

Rollen Datacuratie, Schrijven – review & redactie

Afdeling Pathologie, School of Medicine, Shenzhen University, Shenzhen, China;

Rollen Conceptualisering, Datacuratie, Onderzoek, Middelen

Affiliatie CAS Key Laboratory of Pathogene Microbiology and Immunology, Institute of Microbiology, Chinese Academy of Sciences, Beijing, China

Rollen Conceptualisering, Financiering acquisitie, Projectadministratie, Supervisie, Validatie, Schrijven – review & redactie

Affiliatie Shenzhen Laboratory of Human Antibody Engineering, Institute of Biomedicine and Biotechnology, Shenzhen Institutes of Advanced Technology, Chinese Academie van Wetenschappen, Universiteitsstad Shenzhen, Shenzhen, China

Rollen Conceptualisering, Middelen, Supervisie, Schrijven – review & redactie

Affiliatie Shenzhen Key Laboratory of Pathogen and Immunity, National Clinical Research Center for besmettelijke ziekte, State Key Discipline of Infectious Disease, Shenzhen Third People's Hospital, Second Hospital aangesloten bij Southern University of Science and Technology, Shenzhen, China

Rollen Financiering acquisitie, Onderzoek, Projectadministratie, Schrijven – review & redactie

Affiliation Center for High Performance Computing, Joint Engineering Research Center for Health Big Data Intelligent Analysis Technology, Shenzhen Institutes of Advanced Technology, Chinese Academy of Sciences, Shenzhen, Guangdong, China


Het MOI schatten voor een complex celtype - Biologie

*** xCell is bedoeld voor gebruik met bulkgenexpressie, voor eencellige RNA-seq raden we aan om SingleR te gebruiken: https://github.com/dviraran/SingleR ***

Weefsels zijn een complex milieu dat bestaat uit talrijke celtypen. Bij kanker is het begrijpen van de cellulaire heterogeniteit in de micro-omgeving van de tumor een opkomend onderzoeksgebied. Er zijn de afgelopen jaren talloze methoden gepubliceerd voor het tellen van celsubsets uit weefselexpressieprofielen. De beschikbare methoden hebben echter drie grote problemen: het afleiden van een celsubset op basis van genensets die zijn geleerd en geverifieerd uit beperkte bronnen die slechts een gedeeltelijke weergave van de volledige cellulaire heterogeniteit en onvoldoende validatie in gemengde weefsels vertonen.

xCell is een webtool die analyse van celtypeverrijking uitvoert op basis van genexpressiegegevens voor 64 immuun- en stromaceltypes. xCell is een op gensignaturen gebaseerde methode die is geleerd van duizenden zuivere celtypen uit verschillende bronnen. xCell past een nieuwe techniek toe voor het verminderen van associaties tussen nauw verwante celtypen. xCell handtekeningen werden gevalideerd met behulp van uitgebreide in-silico-simulaties en ook cytometrie-immunofenotypering, en er werd aangetoond dat ze beter presteerden dan eerdere methoden. xCell stelt onderzoekers in staat om het cellulaire heterogeniteitslandschap van weefselexpressieprofielen betrouwbaar weer te geven. Voor meer informatie verwijzen wij u naar de xCell manuscript.

Gebruiken xCell upload eenvoudig een gegevensbestand voor menselijke genexpressie in door tabs gescheiden tekstformaat of csv (tot 1 GB). De expressiematrix moet een matrix zijn met genen in rijen en monsters in kolommen. De rijnamen moeten gensymbolen zijn. Als de gegevens niet-unieke gensymbolen bevatten, worden rijen met dezelfde gensymbolen gemiddeld. xCell gebruikt de rangschikking van expressieniveaus en niet de werkelijke waarden, dus normalisatie heeft geen effect, maar normalisatie naar genlengte (RPKM/FPKM/TPM/RSEM) is vereist.

Belangrijk is dat xCell het beste presteert met een heterogene dataset. Het wordt daarom aanbevolen om alle gegevens gecombineerd in één run te gebruiken en niet in stukjes te splitsen (vooral niet gevallen en controle in verschillende runs).

Markeer of de gegevens een RNA-seq-genexpressieprofiel zijn en kies de xCell handtekeningset (of andere handtekeningsets). Het kan even duren voordat de analyse is voltooid. Geef daarom een ​​e-mailadres op. Een link om de resultaten te downloaden in een door tabs gescheiden bestandsformaat wordt verzonden zodra de analyse is voltooid.

Een voorbeeld van een gegevensbestand voor genexpressie kan hier worden gedownload.

Vooraf berekende TCGA-gegevens door xCell is hier verkrijgbaar. Voer TCGA-gegevens niet uit met de webtool.

*** We slaan geen bestanden op. Alle geüploade gegevens worden na de analyse onmiddellijk verwijderd. Analyseresultaten worden onmiddellijk verwijderd na de eerste download. ***

Een bètaversie van de xCell R-pakket is te vinden in GitHub. Daarnaast een bètaversie van een interactive xCell heatmap-viewer is hier te vinden. Beide zijn in bètaversie en we waarderen de opmerkingen van gebruikers.

xCell is ontwikkeld door het Butte-lab. Neem contact op met Dvir Aran: aran.lab.technion op gmail com voor vragen of suggesties.

Citeren xCell: Aran, Hu en Butte, xCell: het digitaal weergeven van het weefselcellulaire heterogeniteitslandschap. Genoombiologie (2017) 18:220


RESULTATEN

Subcellulaire lokalisatie van PTTG1

We genereerden een polyklonaal antilichaam tegen een carboxy-terminaal fragment van PTTG1-eiwit dat residuen 108-202 bevat. Het affiniteitsgezuiverde antilichaam herkende in Western-blot een dubbele band van ∼29 kDa die overeenkomt met gefosforyleerd en niet-gefosforyleerd PTTG1-eiwit (Ramos Morales et al., 2000 Figuur 1A). De specificiteit van dit antilichaam werd bevestigd door immunoblotting met behulp van eiwitextracten van RPE1-cellen die waren getransfecteerd met gecodeerd klein interfererend RNA (siRNA) of knockdown-PTTG1-siRNA of geïnfecteerd met Lentivirus korte haarspeld PTTG1 RNA uitdrukken (Figuur 1B). Immunokleuring van HeLa- en RPE1-cellen met het affiniteitsgezuiverde antilichaam onthulde dat PTTG1 was geassocieerd met de GA en de kern. Bovendien werd ook een verspreid signaal in het cytoplasma waargenomen (Figuur 1, C, D en G). Het kleurpatroon dat door het PTTG1-antilichaam wordt gegeven, kan worden verminderd door korte haarspeld-RNA (shRNA)-gemedieerde PTTG1-depletie (Figuur 1, E en F) of door pre-incubatie van het antilichaam met het recombinante eiwit dat als antigeen voor de immunisaties wordt gebruikt. Identieke subcellulaire lokalisatie werd waargenomen in de tumorcellijn Cos-7 en in de onsterfelijk gemaakte cellijn NIH3T3 (Figuur 1, F en H), wat bevestigt dat opmerkelijke Golgi-lokalisatie niet afhankelijk is van het celtype.

FIGUUR 1: PTTG1-eiwit is geassocieerd met het GA. (A) Celextracten van RPE1-cellen werden geanalyseerd door Western-blot met behulp van gezuiverd anti-PTTG1-antilichaam (I) en pre-immuun serum (PI). (B) RPE1-cellen werden getransfecteerd met gecodeerde of PTTG1-siRNA-duplexen of geïnfecteerd met Lentivirus korte haarspeld PTTG1 RNA tot expressie brengen. Niveaus van PTTG1-eiwit werden gedetecteerd door Western-blot-analyse. β-actine werd gebruikt als laadcontrole. (C) HeLa- en (D) RPE1-cellen werden geanalyseerd door immunofluorescentie met antilichamen tegen PTTG1 (groen) en GM130 (rood) en met de kleurstof DAPI om DNA (blauw) te visualiseren. (E) RPE1 en (F) Cos-7-cellen waren geïnfecteerd met Lentivirus (MOI = 10) die een gecodeerde korte haarspeld (links) of PTTG1-shRNA (rechts) uitdrukt. Cellen werden gekleurd met antilichamen tegen PTTG1 (groen) en GM130 (rood) en met de kleurstof DAPI om DNA (blauw) te visualiseren. De vakjes in E en F zijn vergroot onderaan elke figuur. (G) RPE1-cellen werden gekleurd met antilichamen tegen PTTG1 (groen) en GM130 (rood). (H) NIH3T3-cellen werden gekleurd met antilichamen tegen PTTG1 (rood) en GM130 (groen).

We hebben in detail de distributie van PTTG1-eiwit in subcellulaire fracties in menselijke promyelocytische HL60-cellen onderzocht. De zuiverheid van fracties werd bepaald door middel van Western-blotting met behulp van antilichamen tegen specifieke eiwitten die als markers van de verschillende organellen worden beschouwd. Verrijking van PTTG1 werd gedetecteerd in oplosbare en onoplosbare nucleaire fracties en snelle membraanfracties die overeenkomen met endoplasmatisch reticulum (ER) en GA (P100-ER). Significante niveaus van PTTG1 werden ook gevonden in de cytosolische fractie S100. Het was echter vrijwel afwezig in met mitochondriën verrijkte fracties (Figuur 2).

FIGUUR 2: Detectie van PTTG1 in subcellulaire fracties van HL60-cellen. Zuiveringsprocedures van subcellulaire fracties werden uitgevoerd zoals beschreven in Materialen en methodes. Eiwitten werden gescheiden door SDS-PAGE, overgebracht naar nitrocellulosemembraan en vervolgens onderzocht met anti-PTTG1 polyklonaal antilichaam. Om de zuiverheid van de verschillende fracties te controleren, werd hetzelfde filter gesondeerd met de volgende specifieke antilichamen: GM130 en GRP78 tegen respectievelijk Golgi-apparaat en endoplasmatisch reticulumfracties, COX IV tegen mitochondriën en protomitochondria-fracties, γ-tubuline tegen centrosomale en Golgi-apparaatfracties , α-tubuline tegen cytoplasmatische fractie en lamin A tegen nucleaire fractie. ER, endoplasmatisch reticulum IN, onoplosbare nucleaire fractie Mit, mitochondriën P100-ER, Golgi-apparaatfractie P350, pellet na 350.000 × G centrifugatie Pro-Mit, protomitochondria S100 en S350, cytosolische fracties na 100.000 en 350.000 × G ultracentrifugatie, respectievelijk SN, oplosbare nucleaire fractie. Blot is representatief voor twee verschillende experimenten.

PTTG1 is gericht op de cis-Golgi, en de lokalisatie ervan is onafhankelijk van de integriteit van de microtubuli

Om de verdeling van het PTTG1-netwerk in de GA nauwkeurig te bepalen, hebben we RPE1-cellen met confocale microscopie geanalyseerd die zijn vastgemaakt met PTTG1-antilichaam en verschillende Golgi-compartimentmarkers. Zoals weergegeven in figuur 3A, vertoonde PTTG1 meer uitgebreide signaaloverlap met de cis-Golgi-eiwit GM130 dan met golgin-245-marker (Figuur 3B). Fluorescentie-intensiteitsprofielen langs lijnen die over het Golgi-gebied zijn getrokken, toonden de mate van correlatie tussen de twee kleurpatronen (Figuur 3, A en B, onderaan). Afbeeldingscorrelatieanalyse, een pixel-naar-pixel vergelijking op basis van de Pearson-correlatiecoëfficiënt, wordt weergegeven in figuur 3C. Terwijl PTTG1 een hoge mate van colokalisatie vertoonde met GM130 (r = 0,7598) was de correlatie met golgin-245 (r = 0,2593) significant lager. Deze resultaten geven aan dat PTTG1 geassocieerd is met de cis kant van de GA. Behandeling met Nocodazole (NZ) depolymeriseert MT's, wat resulteert in fragmentatie van het pericentrosomale GA in kleine stapels die door het cytosol worden verspreid. Na NZ-behandeling blijft PTTG1 geassocieerd met Golgi-ministacks, die een vergelijkbare correlatie vertonen met de genoemde markers (Figuur 4), wat aangeeft dat het richten van PTTG1 op de GA onafhankelijk is van MT- en GA-integriteit.

AFBEELDING 3: PTTG1 wordt geassocieerd met de cis gezicht van de GA. RPE1-cellen waren dubbel gelabeld voor (A) PTTG1 (groen) en GM130 (rood) en (B) PTTG1 (groen) en golgin-245 (rood) en geanalyseerd door confocale microscopie. Samengevoegde afbeeldingen worden weergegeven. Bodem, fluorescentie-intensiteitsprofielen van lijnen getekend over Golgi-membranen in afbeeldingen A en B. (C) Kwantitatieve analyse van colocalisatie was gebaseerd op Pearson's correlatiecoëfficiënt. Waarden zijn gemiddelden van vijf lijnen die op willekeurige posities in 20 verschillende cellen zijn getekend, elke lijn bevat gemiddeld 280 pixels.

FIGUUR 4: PTTG1 wordt geassocieerd met GA in afwezigheid van microtubuli. RPE1-cellen werden gedurende 2 uur behandeld met 10 μM nocodazol en gelabeld voor (A) PTTG1 (groen) en GM130 (rood) of (B) PTTG1 (groen) en golgin-245 (rood). Samengevoegde afbeeldingen worden weergegeven. Vergrote afbeeldingen die deze associatie laten zien, zijn afgebakend in omkaderde gebieden rechts van elke afbeelding. Fluorescentie-intensiteitsprofielen van lijnen die over ministacks in de omkaderde gebieden zijn getrokken, worden rechts getoond.

Fosforylering van PTTG1 door Cdk1 vermindert de lokalisatie ervan naar Golgi-membranen

In eerder werk hebben we aangetoond dat PTTG1 wordt gefosforyleerd op het Ser-165-residu tijdens mitose door Cdk1 (Ramos Morales et al., 2000). De Golgi-lokalisatie van PTTG1 en de fosforylering ervan door Cdk1 suggereren dat PTTG1 zou kunnen worden losgekoppeld van Golgi-ministacks in mitose, zoals gebeurt in andere GA-eiwitten (Lowe et al., 1998 Litouwen et al., 2004). Om deze mogelijkheid aan te tonen, hebben we Golgi-membranen geïsoleerd uit interfase HL60-cellen en deze geïncubeerd met toenemende concentraties histidine (His)-PTTG1-fusie-eiwit. Het recombinante His-PTTG1-fusie-eiwit werd gedetecteerd door immunoblotting met anti-His-antilichaam en het werd voornamelijk gevonden in de pelletfractie, geassocieerd met de Golgi-membranen (Figuur 5A, bovenaan). Fosforylering van His-PTTG1 door Cdk1 verminderde echter met name het vermogen om de gezuiverde Golgi-membranen te binden, en het meeste van het gefosforyleerde His-PTTG1-eiwit werd gevonden in het supernatant (Figuur 5A, onderaan). We besloten vervolgens om te testen of mitotische fosforylering van PTTG1 de interactie met Golgi-membranen zou beïnvloeden door glutamaatsubstitutie te gebruiken, die de eigenschappen van fosfoserine het beste nabootst. Plaatsgerichte mutagenese werd uitgevoerd om fosforyleringsdeficiënte (PTTG1 S165A) en fosfomimetische (PTTG1 S165E) mutanten te genereren. Bindingsexperimenten toonden aan dat de bindingscapaciteit van PTTG1 aan Golgi-membranen onaangetast was na vervanging van de serine door een alanine, maar de PTTG1 S165E-fosfomimetische mutant vertoonde een verminderde bindingscapaciteit aan Golgi-membranen (Figuur 5B). In vivo experimenten werden uitgevoerd met RPE1-cellen die wildtype PTTG1- en PTTG1 S/A- en PTTG1 S/E-mutanten tot expressie brengen, gefuseerd met groen fluorescerend eiwit (GFP) om hun lokalisatie te bepalen. Het rekruteringsniveau werd berekend als de verhouding van de fluorescentie-intensiteit tussen het GA en het cytoplasma. Zoals figuur 6 laat zien, werden GFP-PTTG1- en GFP-PTTG1 S/A-eiwitten bij voorkeur gerekruteerd voor GA (ratio, respectievelijk 2,10 ± 0,18 en 1,86 ± 0,05). Het GFP-PTTG1 S/E-fosfomimetische eiwit was minder geaccumuleerd in GA en het was ook aanwezig als een diffuus gedispergeerd eiwit in het cytoplasma (verhouding 1,46 ± 0,02). Over het algemeen suggereren deze resultaten dat bij mitose het grootste deel van het gefosforyleerde PTTG1-eiwit afwezig is in de Golgi-ministacks en dat de fosforylering ervan door Cdk1 deze dissociatie zou kunnen vergemakkelijken.

FIGUUR 5: Binding van PTTG1 aan Golgi-membranen.(A) Fosforylering van PTTG1 door Cdk1-kinase vergemakkelijkt de dissociatie van Golgi-membranen. Geïsoleerde Golgi-membranen (10 g) werden geïncubeerd met toenemende concentratie gezuiverd His-PTTG1 of His-PTTG1 dat in vitro door Cdk1 werd gefosforyleerd. De associatie van het recombinante eiwit met de Golgi-membranen (pellet) werd bepaald door immunoblotting met anti-His-antilichaam. Rechts, Western-blot van in vitro gefosforyleerd PTTG1 door Cdk1 en gedefosforyleerd PTTG1 door alkalische fosfatase (AP). (B) Binding van PTTG1-mutanten aan Golgi-membranen. Golgi-membranen werden in vitro geïncubeerd met de fosforyleringsdeficiënte mutant His-PTTG1 S/A en met de fosfomimetische mutant His-PTTG1 S/E (700 ng). De associatie van het recombinante eiwit met de Golgi-membranen (pellet) werd bepaald door immunoblotting met anti-His-antilichaam. Rechts, Western blot van membranen (10 g) en mutante fusie-eiwitten met behulp van anti-PTTG1-antilichaam.

FIGUUR 6: Vervanging van serine 165 beïnvloedt de rekrutering van intact PTTG1 naar het Golgi-apparaat. RPE1-cellen werden getransfecteerd met GFP-PTTG1, GFP-PTTG1-S/A en GFP-PTTG1-S/E. De cellen werden gekleurd met anti-GM130 antilichaam en DAPI. Juist, samengevoegde afbeeldingen. Relatieve GA-werving (gemiddelde ± SD) van elke constructie wordt rechts getoond. N = 35-50 cellen gescoord per constructie uit twee onafhankelijke experimenten. Schaalbalken, 50 m.

Om de regio van PTTG1 te identificeren die betrokken is bij de associatie met de GA, hebben we de glutathion gegenereerd S-transferase (GST)-gefuseerde afgeknotte vormen GST-PTTG1ΔC en GST-PTTG1ΔN, die respectievelijk de 82 C-terminale residuen en 108 N-terminale residuen missen. Incubatie van Golgi-membranen met deze afgeknotte vormen toonde aan dat GST-PTTG1ΔC nog steeds geassocieerd is met Golgi-membranen (supplementaire figuur S1), wat aangeeft dat de interactie werd gemedieerd via het N-terminale gebied van het PTTG1-eiwit.

PTTG1 associeert met microtubule-nucleatiecomplexen, en de afwezigheid ervan verzwakt MT-repolymerisatie na NZ-uitdaging

De colokalisatie van PTTG1 en GM130 waargenomen door confocale microscopie bracht ons ertoe te onderzoeken of PTTG1 interageert met dit eiwit en/of met enkele van zijn bindingspartners. Endogeen GM130 werd geco-immunoprecipiteerd met endogeen PTTG1 uit RPE1-celextracten met behulp van het anti-PTTG1-antilichaam (Figuur 7A). Deze interactie werd ook waargenomen tussen exogeen tot expressie gebracht GM130 en PTTG1 (gegevens niet getoond). AKAP450, een centrosomaal en Golgi-geassocieerd γ−TURC-interactief eiwit dat specifiek de cis kant van de Golgi op een GM130-afhankelijke manier, ook co-immunoprecipitatie met PTTG1. AKAP450 associeert indirect met γ-tubuline door binding met γ-tubuline complex eiwit 2 (GCP2) en/of GCP3 en GM130. Zoals verwacht werd γ-tubuline ook geco-immunoprecipiteerd met anti-PTTG1-antilichaam (Figuur 7A). Of deze interacties direct zijn of niet, moet nog worden bepaald. We hebben ook getest of PTTG1 deze eiwitten kon binden in een pull-down-assay en of deze interacties werden beïnvloed door fosforylering van het Ser-165-residu. Hele celextracten van RPE1-cellen werden geïncubeerd met korrels die waren gecoat met gefosforyleerd en niet-gefosforyleerd His-gelabeld PTTG1. Beide versies van PTTG1 bonden aan GM130-, AKAP450- en -tubuline-eiwitten, hoewel deze associaties enigszins afnam met het gefosforyleerde PTTG1, vooral in het geval van de γ-tubuline-interactie (Figuur 7B). De interactie van deze eiwitten met de GST-gefuseerde afgeknotte vormen GST-PTTG1ΔC en GST-PTTG1ΔN werd ook getest in een pull-down-assay zoals weergegeven in figuur 7C, AKAP450, GM130 en γ-tubuline associëren preferentieel met het N-terminale gebied van het PTTG1-eiwit.

FIGUUR 7: In vivo en in vitro interacties van PTTG1 met eiwitten die betrokken zijn bij microtubuli kiemvorming. (A) Co-immunoprecipitatie van PTTG1, AKAP450, GM130 en γ-tubuline van RPE1-cellen met behulp van anti-PTTG1-antilichaam. α-tubuline werd gebruikt als negatieve controle. Een hoeveelheid van 1/20 van de input-eiwitten die in het co-immunoprecipitatie-experiment werden gebruikt, werd geanalyseerd door Western-blotting met antilichamen tegen AKAP450, GM130 en γ-tubuline. IP, immunoprecipitaten. (B) Interactie van AKAP450, GM130 en γ-tubuline met niet-gefosforyleerd PTTG1 en Cdk1-gefosforyleerd PTTG1. His-gelabelde fusie-eiwitten werden geïncubeerd met RPE1-extracten en hun associatie met AKAP450, GM130 en γ-tubuline werd bepaald door immunoblotting. Een hoeveelheid van 1/10 van de input-eiwitten die in het pull-down-experiment werden gebruikt, werd geanalyseerd door Western-blotting met antilichamen tegen elk eiwit. (C) Interactie van AKAP450, GM130 en γ-tubuline met GST-gefuseerde afgeknotte vormen van PTTG1. Deze experimenten werden uitgevoerd zoals beschreven in B.

Rekening houdend met het feit dat AKAP450 en γ-tubuline MT-kiemvormingsplaatsen aan het centrosoom verschaffen en dat GM130, door AKAP450 te verankeren, deelneemt aan MT-kiemvorming bij de GA, hebben we geanalyseerd of de afwezigheid van PTTG1 het MT-kiemvormingsproces beïnvloedde. Om geacetyleerde en niet-geacetyleerde microtubuli te depolymeriseren, werden PTTG1-verarmde en controle RPE1-cellen behandeld met 10 μM NZ gedurende 2 uur bij 37 ° C en vervolgens gedurende 40 minuten bij 4 ° C geïncubeerd, de MT-kiemvorming werd op verschillende tijdstippen geanalyseerd na uitwassen en incubatie van NZ bij 37°C. Er werd een opmerkelijk verschil waargenomen tussen controle- en PTTG1-verarmde cellen. In controlecellen begonnen niet-centrosomale MT's 10 minuten na het uitwassen van NZ te verschijnen, en werden ze na 20 minuten duidelijker in verse media (Figuur 8, B, C en M). In PTTG1-uitgeputte cellen was de kiemvorming van centrosomale en niet-centrosomale MT's echter vertraagd en was het aantal MT's aanzienlijk verminderd. In feite waren centrosomale en niet-centrosomale MT's afwezig in PTTG1-uitgeputte cellen 10 minuten na NZ-uitspoeling en nauwelijks zichtbaar 10 minuten later (Figuur 8, H en I). Verschillen in nucleatie werden nog steeds waargenomen 40 min na NZ wash-out (Figuur 8, M en S), en ze werden op langere tijden verminderd (60 min Figuur 8, N en T). Controle- en PTTG1-uitgeputte cellen vertoonden een vergelijkbaar microtubule-netwerk 90 min na NZ-uitspoeling (Figuur 8, O en U).

Het effect van PTTG1 op centrosomale MT-nucleatie, samen met de interactie met γ-tubuline en AKAP450, suggereert een rol van PTTG1 in het centrosoom. Eigenlijk werd de intracellulaire locatie van GFP-PTTG1-fusie-eiwit in het centrosoom gerapporteerd in HCT116-cellen (Tong et al., 2008) hebben we bovendien met behulp van ons PTTG1-antilichaam endogeen PTTG1 gelokaliseerd in het centrosoom in zowel Cos-7- als RPE1-cellen (Figuur 9). Deze intracellulaire locatie ondersteunt een effectieve interactie van PTTG1 met γ-tubuline en AKAP450 centrosomale eiwitten.

FIGUUR 8: PTTG1-uitputting interfereert met de herpolymerisatie van microtubuli. RPE1-controle (A-F, M-R) of PTTG1-verarmde (G-L, S-Y) cellen werden 2 uur bij 37 ° C behandeld met NZ (10 M) en vervolgens 40 minuten bij 4 ° C geïncubeerd , gefixeerd en gekleurd voor α-tubuline (rood) en golgin-245 (groen) na 5 min (A, D, G, J), 10 min (B, E, H, K), 20 min (C, F , I, L), 40 min (M, P, S, V), 60 min (N, Q, T, X) of 90 min (O, R, U, Y) NZ wash-out. Omgekeerde afbeeldingen van tubulinekleuring worden getoond in A–C, G–I, M–O en S–U. Samengevoegde afbeeldingen worden weergegeven in D–F, J–L, P–R en V–Y. Schaalbalken, 25 m.

FIGUUR 9: Centrosomale lokalisatie van PTTG1. Antilichamen tegen endogene PTTG1- en γ-tubuline- of CTR453-eiwitten werden gebruikt in COS-7 (A-C) en RPE1 (D-O) -cellen om centrosomale colokalisatie aan te tonen. Om de specificiteit van centrosomale labeling te testen, werden RPE1-cellen geïnfecteerd met scramble-shRNA (G-I) of PTTG1-shRNA (J-O) lentivirale vectoren (MOI = 10). Na 72 uur werden cellen gefixeerd in methanol en verwerkt voor immunofluorescentie. Linker en middelste, omgekeerde afbeeldingen van respectievelijk PTTG1- en γ-tubuline- of CTR453-kleuring. Rechts, samengevoegde afbeeldingen met PTTG1 in groen en CTR453 en γ-tubuline in rood. De kleine inzet komt overeen met het omkaderde gebied in elke figuur. Schaalbalken, 25 m.

Aangezien GM130 AKAP450 verankert aan de cis-Golgi (Rivero et al., 2009), hebben we onderzocht of PTTG1 nodig is voor deze rekrutering. Uitputting van PTTG1 had blijkbaar geen invloed op de interactie tussen AKAP450 en GM130 op de GA (supplementaire figuur S2). Verder gaf Western-blot-analyse aan dat niveaus van GM130, γ-tubuline en AKAP450 niet significant worden beïnvloed na PTTG1-uitputting (supplementaire figuur S3). We concluderen dat, hoewel het overbodig lijkt, PTTG1 betrokken is bij MT-nucleatie, waarschijnlijk door, als chaperonne, de nucleatie van centrosomale en niet-centrosomale microtubuli te vergemakkelijken.

Migratiedefecten in PTTG1-uitgeputte RPE1-cellen

Aangezien MT's onmisbaar zijn voor gepolariseerde celmigratie en PTTG1-uitputting het nucleatieproces van MT's vertraagt, hebben we getest of PTTG1-uitputting de celmigratie beïnvloedde. In een wondgenezingstest werden cellen geïnfecteerd met controle shRNA Lentivirus verplaatst naar het wondgebied en vult het gat dat door de kras is ontstaan ​​binnen 21 uur. Daarentegen cellen geïnfecteerd met PTTG1 shRNA Lentivirus had minstens 27 uur nodig om de kloof te dichten (Figuur 10A). De analyse van de beweging van individuele cellen toonde aan dat RPE1-controlecellen op een directioneel persistente manier migreren (Figuur 10B, links). Daarentegen vertoonden PTTG1-verarmde cellen willekeurige migratie (Figuur 10B, rechts), wat suggereert dat PTTG1 betrokken is bij het celmigratieproces. Om te onderzoeken of dit defect in migratie te wijten was aan GA / centrosoom-misoriëntatie, analyseerden we de heroriëntatie van deze organellen in scramble en PTTG1-uitgeputte cellen 7 uur na verwonding. Immunokleuring met antilichamen tegen GM130 en γ-tubuline en nucleaire kleuring met 4′,6-diamidino-2-fenylindol (DAPI), gevolgd door kwantitatieve analyse, bevestigden dat 38% van de PTTG1-verarmde cellen een verkeerd georiënteerd GA/centrosoom vertoonden vergeleken met 10 % gecodeerde controlecellen (Figuur 10, C-E). PTTG1-uitputting beïnvloedt de Golgi/centrosoom-heroriëntatie en daarom gerichte celmigratie, waardoor de effectieve migratie met een factor 2,2 wordt verminderd (Figuur 10F). Bovendien gaf een schatting van de migratiesnelheid een verlaging van 30% aan voor de knockdown-cellen (Figuur 10G). Daarom was de verslechtering van de wondgenezing het gevolg van een verlies in directioneel persistente migratie en een verlies van algemene celmotiliteit.

FIGUUR 10: Migratiedefecten in PTTG1-verarmde cellen. (A) Levende RPE1-cellen die zijn geïnfecteerd met controle- of shRNA-lentivirussen (MOI = 10) werden gedurende 27 uur afgebeeld met intervallen van 7 minuten. De frames van de film op 0 en 17 uur worden gepresenteerd en gebruikt om het percentage van het oppervlak dat door de cellen wordt bedekt te schatten. Het laatste frame om 27u wordt ook getoond. (B) Migratiesporen van willekeurig gekozen cellen worden in verschillende kleuren gepresenteerd. (C) Representatief immunofluorescentie-experiment van PTTG1-verarmde cellen op 7 uur na verwonding. Cellen werden gekleurd met anti-GM130 (groen), γ-tubuline (rood) en DAPI. Cellen werden als correct georiënteerd beschouwd als het Golgi en het centrosoom zich in het kwadrant voor de kern bevonden en naar de kras gericht waren (witte lijn). Schaalbalk, 10 m. (D) Vergrote weergave van het omkaderde gebied in C. (E) Percentage van controle en PTTG1-verarmde cellen met Golgi en centrosoom correct geheroriënteerd. Van elke conditie werden meer dan 90 cellen gemeten. (F) Directioneel aanhoudende migratieafstand van controle en PTTG1-verarmde cellen. De directioneel persistente migratie (D/T) is de verhouding van de directe afstand van start- tot eindpunt (D) gedeeld door de totale spoorafstand (T). Voor elk genotype werden tweeëntwintig cellen gemeten. (G) Migratiesnelheid (μm/h) van controle- en PTTG1-uitgeputte cellen. Foutbalken, ±SD.


Aderen

Het hart heeft zijn eigen bloedvaten die de hartspier van bloed voorzien. De kransslagaders vertakken zich van de aorta en omringen het buitenoppervlak van het hart als een kroon. Ze divergeren in haarvaten waar de hartspier van zuurstof wordt voorzien voordat ze weer samenkomen in de kransaderen om het zuurstofarme bloed terug naar het rechter atrium te brengen, waar het bloed opnieuw van zuurstof wordt voorzien via het longcircuit.

Atherosclerose is de verstopping van een slagader door de opeenhoping van vette plaques. De hartspier zal sterven zonder een constante toevoer van bloed vanwege de smalle omvang van de kransslagaders en hun functie bij het dienen van het hart zelf, atherosclerose kan dodelijk zijn in deze slagaders. De vertraging van de bloedstroom en daaropvolgende zuurstofgebrek kan ernstige pijn veroorzaken, bekend als angina. Volledige blokkering van de slagaders veroorzaakt een myocardinfarct en de dood van hartspierweefsel, wat algemeen bekend staat als een hartaanval.


Resultaten

Onderdelen van een experimenteel bepaald evolutionair model

Gezien het evolutionaire model beschreven door vergelijking (1), is de uitdaging om de mutatiesnelheden experimenteel te schatten Qxy en de fixatiekansen FR,xy. In de volgende paragrafen beschrijf ik deze experimenten.

Meting van mutatiesnelheden

Een algemene uitdaging bij het kwantificeren van mutatiesnelheden is de moeilijkheid om mutaties te scheiden van de daaropvolgende selectie die erop inwerkt. Om mutatie los te koppelen van selectie, heb ik een eerder beschreven methode gebruikt voor het kweken van influenzavirussen die groen fluorescerend eiwit (GFP) in het PB1-segment verpakken (Bloom et al. 2010). De GFP draagt ​​niet bij aan virale groei en staat dus niet onder functionele selectie - daarom accumuleren substituties in dit gen met de mutatiesnelheid.

Om de snelle accumulatie van substituties in het GFP-gen te stimuleren, heb ik mutatie-accumulatie-experimenten met beperkende verdunning uitgevoerd (Halligan en Keightley 2009). In het bijzonder heb ik 24 replicapopulaties van GFP-dragende influenzavirussen gepasseerd door verdunning in weefselkweek te beperken, waarbij bij elke passage het virus serieel werd verdund tot de laagste concentratie die in staat is doelcellen te infecteren. Omdat elke beperkende verdunning de populatie tot een of enkele infectieuze virionen vernauwt, fixeren mutaties zich snel. Na 25 passagerondes werd het GFP-gen voor elke replicaat volgens Sanger-sequentie bepaald om 24 substituties te identificeren (tabellen 1 en 2), voor een totaal aantal mutaties per nucleotide per generatie weefselkweek - een waarde die vergelijkbaar is met de waarde die eerder door anderen werd geschat met behulp van een enigszins andere experimentele benadering (Parvin et al. 1986). De snelheden van verschillende soorten mutaties staan ​​in tabel 3 en hebben verwachte kenmerken zoals een verhoging van overgangen ten opzichte van transversies.

Mutaties geïdentificeerd door sequentiebepaling van het 720-nucleotide GFP-gen verpakt in het PB1-segment na 25 beperkende verdunningspassages voor 24 onafhankelijke replicaten.

Kloon . Mutaties.
Kloon 1 G62T (G21V), T693C (synoniem), del153-522 (indel)
Kloon 2 Geen
Kloon 3 C29T (T10I)
Kloon 4 Geen
Kloon 5 Geen
Kloon 6 G429A (synoniem), C447T (synoniem)
Kloon 7 Geen
Kloon 8 Geen
Kloon 9 C646A (R216S)
Kloon 10 G471T (K157N), G703A (D235N)
Kloon 11 T111C (synoniem), T718G (*240E)
Kloon 12 T25C (F9L), T26C (F9S)
Kloon 13 C45T (synoniem), C549T (synoniem)
Kloon 14 T319C (Y107H), C372T (synoniem), C539T (A180V)
Kloon 15 A488C (K163T)
Kloon 16 G274T (G92C)
Kloon 17 Geen
Kloon 18 Geen
Kloon 19 Geen
Kloon 20 G527A (S176N), A676G (T226A)
Kloon 21 G4A (V2I)
Kloon 22 T266C (M89T)
Kloon 23 Geen
Kloon 24 C30T (synoniem), del45-590 (indel)
Kloon . Mutaties.
Kloon 1 G62T (G21V), T693C (synoniem), del153-522 (indel)
Kloon 2 Geen
Kloon 3 C29T (T10I)
Kloon 4 Geen
Kloon 5 Geen
Kloon 6 G429A (synoniem), C447T (synoniem)
Kloon 7 Geen
Kloon 8 Geen
Kloon 9 C646A (R216S)
Kloon 10 G471T (K157N), G703A (D235N)
Kloon 11 T111C (synoniem), T718G (*240E)
Kloon 12 T25C (F9L), T26C (F9S)
Kloon 13 C45T (synoniem), C549T (synoniem)
Kloon 14 T319C (Y107H), C372T (synoniem), C539T (A180V)
Kloon 15 A488C (K163T)
Kloon 16 G274T (G92C)
Kloon 17 Geen
Kloon 18 Geen
Kloon 19 Geen
Kloon 20 G527A (S176N), A676G (T226A)
Kloon 21 G4A (V2I)
Kloon 22 T266C (M89T)
Kloon 23 Geen
Kloon 24 C30T (synoniem), del45-590 (indel)

Noot.—De nummering is sequentieel beginnend met het eerste nucleotide van het GFP-startcodon. Voor niet-synonieme mutaties wordt de geïnduceerde aminozuurverandering tussen haakjes aangegeven.

Mutaties geïdentificeerd door sequentiebepaling van het 720-nucleotide GFP-gen verpakt in het PB1-segment na 25 beperkende verdunningspassages voor 24 onafhankelijke replicaten.

Kloon . Mutaties.
Kloon 1 G62T (G21V), T693C (synoniem), del153-522 (indel)
Kloon 2 Geen
Kloon 3 C29T (T10I)
Kloon 4 Geen
Kloon 5 Geen
Kloon 6 G429A (synoniem), C447T (synoniem)
Kloon 7 Geen
Kloon 8 Geen
Kloon 9 C646A (R216S)
Kloon 10 G471T (K157N), G703A (D235N)
Kloon 11 T111C (synoniem), T718G (*240E)
Kloon 12 T25C (F9L), T26C (F9S)
Kloon 13 C45T (synoniem), C549T (synoniem)
Kloon 14 T319C (Y107H), C372T (synoniem), C539T (A180V)
Kloon 15 A488C (K163T)
Kloon 16 G274T (G92C)
Kloon 17 Geen
Kloon 18 Geen
Kloon 19 Geen
Kloon 20 G527A (S176N), A676G (T226A)
Kloon 21 G4A (V2I)
Kloon 22 T266C (M89T)
Kloon 23 Geen
Kloon 24 C30T (synoniem), del45-590 (indel)
Kloon . Mutaties.
Kloon 1 G62T (G21V), T693C (synoniem), del153-522 (indel)
Kloon 2 Geen
Kloon 3 C29T (T10I)
Kloon 4 Geen
Kloon 5 Geen
Kloon 6 G429A (synoniem), C447T (synoniem)
Kloon 7 Geen
Kloon 8 Geen
Kloon 9 C646A (R216S)
Kloon 10 G471T (K157N), G703A (D235N)
Kloon 11 T111C (synoniem), T718G (*240E)
Kloon 12 T25C (F9L), T26C (F9S)
Kloon 13 C45T (synoniem), C549T (synoniem)
Kloon 14 T319C (Y107H), C372T (synoniem), C539T (A180V)
Kloon 15 A488C (K163T)
Kloon 16 G274T (G92C)
Kloon 17 Geen
Kloon 18 Geen
Kloon 19 Geen
Kloon 20 G527A (S176N), A676G (T226A)
Kloon 21 G4A (V2I)
Kloon 22 T266C (M89T)
Kloon 23 Geen
Kloon 24 C30T (synoniem), del45-590 (indel)

Noot.—De nummering is sequentieel beginnend met het eerste nucleotide van het GFP-startcodon. Voor niet-synonieme mutaties wordt de geïnduceerde aminozuurverandering tussen haakjes aangegeven.

Telt voor verschillende soorten mutaties na de 25 beperkende verdunningspassages.

Mutatietype. Aantal Voorvallen .
Totaal vervangingen 24
transversies 6
Overgangen 18
niet-synoniem 15
Synoniem 8
Stop codons 1
Indels 2
T → G 1
T → C 6
T → A 0
G → T 3
G → C 0
G → A 4
C → T 7
C → G 0
C → A 1
A → T 0
A → G 1
A → C 1
Mutatietype. Aantal Voorvallen .
Totaal vervangingen 24
transversies 6
Overgangen 18
niet-synoniem 15
Synoniem 8
Stop codons 1
Indels 2
T → G 1
T → C 6
T → A 0
G → T 3
G → C 0
G → A 4
C → T 7
C → G 0
C → A 1
A → T 0
A → G 1
A → C 1

Noot.—De getallen zijn berekend aan de hand van tabel 1. Aangezien GFP 720 nucleotiden lang is, suggereren de gegevens een virale mutatiesnelheid van mutaties per nucleotide per generatie weefselkweek.

Telt voor verschillende soorten mutaties na de 25 beperkende verdunningspassages.

Mutatietype. Aantal Voorvallen .
Totaal vervangingen 24
transversies 6
Overgangen 18
niet-synoniem 15
Synoniem 8
Stop codons 1
Indels 2
T → G 1
T → C 6
T → A 0
G → T 3
G → C 0
G → A 4
C → T 7
C → G 0
C → A 1
A → T 0
A → G 1
A → C 1
Mutatietype. Aantal Voorvallen .
Totaal vervangingen 24
transversies 6
Overgangen 18
niet-synoniem 15
Synoniem 8
Stop codons 1
Indels 2
T → G 1
T → C 6
T → A 0
G → T 3
G → C 0
G → A 4
C → T 7
C → G 0
C → A 1
A → T 0
A → G 1
A → C 1

Noot.—De getallen zijn berekend aan de hand van tabel 1. Aangezien GFP 720 nucleotiden lang is, suggereren de gegevens een virale mutatiesnelheid van mutaties per nucleotide per generatie weefselkweek.

Mutatietype. Tarief .
A → G, T → C (overgang)
G → A, C → T (overgang)
A → C, T → G (transversie)
C → A, G → T (transversie)

De codon-mutantbibliotheken zoals bepaald door Sanger-sequentiebepaling van 30 individuele klonen. (EEN) De klonen hebben gemiddeld 2,7 codonmutaties en 0,1 indels per NP-coderende sequentie van volledige lengte, waarbij het aantal gemuteerde codons per gen een ongeveer Poisson-verdeling volgt. (B) Het aantal nucleotideveranderingen per codonmutatie is ongeveer zoals verwacht als elk codon willekeurig wordt gemuteerd naar een van de andere 63 codons, met een lichte verhoging van enkelvoudige nucleotidemutaties. (C) De mutante codons hebben een uniforme basissamenstelling. (NS) Mutaties vinden uniform plaats langs de primaire sequentie. (E) In klonen met meerdere mutaties is er geen neiging tot clustering van mutaties. Getoond wordt de werkelijke verdeling van paarsgewijze afstanden tussen mutaties in alle meervoudig gemuteerde klonen vergeleken met de verdeling gegenereerd door 1.000 simulaties waarbij mutaties willekeurig langs de primaire sequentie van elke meervoudig gemuteerde kloon worden geplaatst. De gegevens en code voor dit cijfer zijn beschikbaar op https://github.com/jbloom/SangerMutantLibraryAnalysis/tree/v0.21 (laatst geraadpleegd op 31 mei 2014).

De codon-mutantbibliotheken zoals bepaald door Sanger-sequentiebepaling van 30 individuele klonen. (EEN) De klonen hebben gemiddeld 2,7 codonmutaties en 0,1 indels per NP-coderende sequentie van volledige lengte, waarbij het aantal gemuteerde codons per gen een ongeveer Poisson-verdeling volgt. (B) Het aantal nucleotideveranderingen per codonmutatie is ongeveer zoals verwacht als elk codon willekeurig wordt gemuteerd naar een van de andere 63 codons, met een lichte verhoging van enkelvoudige nucleotidemutaties. (C) De mutante codons hebben een uniforme basissamenstelling. (NS) Mutaties vinden uniform plaats langs de primaire sequentie. (E) In klonen met meerdere mutaties is er geen neiging tot clustering van mutaties. Getoond wordt de werkelijke verdeling van paarsgewijze afstanden tussen mutaties in alle meervoudig gemuteerde klonen vergeleken met de verdeling gegenereerd door 1.000 simulaties waarbij mutaties willekeurig langs de primaire sequentie van elke meervoudig gemuteerde kloon worden geplaatst. De gegevens en code voor dit cijfer zijn beschikbaar op https://github.com/jbloom/SangerMutantLibraryAnalysis/tree/v0.21 (laatst geraadpleegd op 31 mei 2014).

Om de effecten van de mutaties op virale replicatie te beoordelen, werden de plasmidemutantbibliotheken gebruikt om pools van mutante influenzavirussen te creëren door middel van omgekeerde genetica (Hoffmann et al. 2000). De virussen werden tweemaal overgezet in weefselkweek met een lage MOI om een ​​koppeling tussen genotype en fenotype af te dwingen. Het NP-gen werd reverse-getranscribeerd en PCR-geamplificeerd uit viraal RNA na elke passage, en vergelijkbare PCR-amplicons werden gegenereerd uit de plasmidemutantbibliotheken en een verscheidenheid aan controles die waren ontworpen om fouten te kwantificeren die verband houden met sequencing, reverse transcriptie en virale passage (fig. 2 ). Het hele proces dat in figuur 2 wordt geschetst, werd parallel maar afzonderlijk uitgevoerd voor elk van de vier mutantbibliotheken (WT-1, WT-2, N334H-1 en N334H-2) in wat één experimenteel replicaat zal worden genoemd. Dit hele proces van virale creatie, passage en sequencing werd vervolgens onafhankelijk herhaald voor alle vier de bibliotheken in een tweede experimentele replica. De twee onafhankelijke replica's worden replica A en replica B genoemd.

Ontwerp van het diepe mutatiescan-experiment. De gesequenced monsters zijn in het geel. Blauwe tekst geeft bronnen van mutatie aan en selectie rode tekst geeft bronnen van fouten aan. De interessante vergelijking is tussen de mutatiefrequenties in de mutDNA- en mutvirusmonsters, omdat veranderingen in frequenties tussen deze monsters de actie van selectie vertegenwoordigen. Omdat sommige van de experimentele technieken echter het potentieel hebben om fouten te introduceren, worden de andere monsters ook gesequenced om deze onbedoelde foutenbronnen te kwantificeren. Elk van de twee experimentele replica's (replicaten A en B) omvatte het onafhankelijk herhalen van het gehele proces van virale redding, virale passage en sequentiebepaling voor elk van de vier plasmidemutantbibliotheken (WT-1, WT-2, N334H-1 en N334H- 2).

Ontwerp van het diepe mutatiescan-experiment. De gesequenced monsters zijn in het geel. Blauwe tekst geeft bronnen van mutatie aan en selectie rode tekst geeft bronnen van fouten aan. De interessante vergelijking is tussen de mutatiefrequenties in de mutDNA- en mutvirusmonsters, omdat veranderingen in frequenties tussen deze monsters de actie van selectie vertegenwoordigen. Omdat sommige van de experimentele technieken echter het potentieel hebben om fouten te introduceren, worden de andere monsters ook gesequenced om deze onbedoelde foutenbronnen te kwantificeren. Elk van de twee experimentele replica's (replicaten A en B) omvatte het onafhankelijk herhalen van het volledige proces van virale redding, virale passage en sequentiebepaling voor elk van de vier plasmidemutantbibliotheken (WT-1, WT-2, N334H-1 en N334H- 2).

De mutatiefrequenties in alle monsters werden gekwantificeerd door Illumina-sequencing, met behulp van overlappende reads met gepaarde uiteinden om fouten te verminderen (aanvullend fig. S1, aanvullend materiaal online). Elk monster produceerde ≈107 gepaarde uitlezingen die konden worden uitgelijnd met NP, wat een gemiddelde van ≈5 × 105 oproepen per codon opleverde (aanvullend fig. S2, aanvullend materiaal online). Sequentiebepaling van niet-gemuteerd NP-plasmide bracht een laag foutenpercentage aan het licht, die bijna uitsluitend veranderingen van enkelvoudige nucleotiden waren (fig. 3). Zoals verwacht bevatten de plasmidemutantbibliotheken een hoge frequentie van enkelvoudige en multinucleotide codonmutaties (fig. 3). Mutatiefrequenties voor niet-gemuteerd RNA of virussen gemaakt van niet-gemuteerd NP-plasmide lagen slechts iets boven het sequentiefoutpercentage (fig. 3), wat aangeeft dat reverse transcriptie en virale replicatie weinig mutaties introduceerden ten opzichte van de gerichte mutagenese in de plasmidebibliotheken. Mutatiefrequenties waren verminderd in de mutante virussen ten opzichte van de mutante plasmiden die werden gebruikt om deze virussen te maken, met name voor niet-synonieme en stop-codon-mutaties (fig. 3) - consistent met selectie die schadelijke mutaties verwijdert. Deze resultaten geven aan dat het diepe mutatiescan-experiment met succes veel van de NP-varianten in de plasmidemutantbibliotheken heeft geïntroduceerd in mutante virussen, die vervolgens werden onderworpen aan zuiverende selectie tegen mutaties die interfereren met virale replicatie.

Per-codon-mutatiefrequenties voor elke bibliotheek (WT-1, WT-2, N334H-1 en N334H-2) in (EEN) repliceren A of (B) repliceren B. De monsters worden genoemd zoals in figuur 2. Fouten als gevolg van Illumina-sequencing (DNA-monster), reverse transcriptie (RNA-monster) en virale replicatie (virus-p1- en virus-p2-monsters) zijn zeldzaam en zijn meestal enkelvoudig nucleotide veranderingen. De codon-mutantbibliotheken (mutDNA) bevatten een hoge frequentie van enkelvoudige en multinucleotide-veranderingen zoals verwacht van Sanger-sequencing (meest rechtse balken van deze grafiek en figuur 1 merk op dat Sanger-sequencing niet onderhevig is aan Illumina-sequencingfouten die van invloed zijn op alle andere monsters) . Mutaties zijn verminderd in mutvirusmonsters ten opzichte van mutDNA-plasmiden die worden gebruikt om deze mutante virussen te maken, met de meeste reductie in stop-codon- en niet-synonieme mutaties - zoals verwacht als schadelijke mutaties worden verwijderd door zuiverende selectie. Details van de analyse die is gebruikt om deze cijfers te genereren, zijn te vinden op http://jbloom.github.io/mapmuts/example_2013Analysis_Influenza_NP_Aichi68.html (laatst geraadpleegd op 31 mei 2014).

Per-codon-mutatiefrequenties voor elke bibliotheek (WT-1, WT-2, N334H-1 en N334H-2) in (EEN) repliceren A of (B) repliceren B. De monsters worden genoemd zoals in figuur 2. Fouten als gevolg van Illumina-sequencing (DNA-monster), reverse transcriptie (RNA-monster) en virale replicatie (virus-p1- en virus-p2-monsters) zijn zeldzaam en zijn meestal enkelvoudig nucleotide veranderingen. De codon-mutantbibliotheken (mutDNA) bevatten een hoge frequentie van enkelvoudige en multinucleotide-veranderingen zoals verwacht van Sanger-sequencing (meest rechtse balken van deze grafiek en figuur 1 merk op dat Sanger-sequencing niet onderhevig is aan Illumina-sequencingfouten die van invloed zijn op alle andere monsters) . Mutaties in mutvirusmonsters zijn verminderd in vergelijking met mutDNA-plasmiden die worden gebruikt om deze mutante virussen te maken, met de meeste reductie in stop-codon- en niet-synonieme mutaties - zoals verwacht als schadelijke mutaties worden verwijderd door zuiverende selectie. Details van de analyse die is gebruikt om deze cijfers te genereren, zijn te vinden op http://jbloom.github.io/mapmuts/example_2013Analysis_Influenza_NP_Aichi68.html (laatst geraadpleegd op 31 mei 2014).

Een belangrijke vraag is in hoeverre de mogelijke mutaties zijn bemonsterd in zowel de plasmidemutantbibliotheken als de mutante virussen die uit deze plasmiden zijn gemaakt. De diepe mutatiescan zou zijn doel niet bereiken als slechts een klein deel van de mogelijke mutaties wordt bemonsterd door de mutante plasmiden of door de mutante virussen die op basis van deze plasmiden zijn gemaakt (dit laatste kan het geval zijn als er een knelpunt is tijdens de viruscreatie, zodat alle virussen worden gegenereerd uit slechts enkele plasmiden). Gelukkig laat figuur 4 zien dat de bemonstering van mutaties vrij uitgebreid was in zowel de mutante plasmiden als de mutante virussen. In het bijzonder suggereert figuur 4 dat voor elk replicaat bijna alle codonmutaties talloze keren werden bemonsterd in de plasmidemutantbibliotheken en dat meer dan 75% van de codonmutaties werden bemonsterd door de mutante virussen. Figuur 4 suggereert ook dat replica A technisch superieur was aan replica B in de grondigheid waarmee mutaties werden bemonsterd door de mutante virussen. Omdat de meeste aminozuren worden gecodeerd door meerdere codons, is de fractie van aminozuurmutaties die in elk replicaat worden bemonsterd zelfs hoger dan de >75% van de bemonsterde codonmutaties. Dus hoewel de experimenten misschien niet alle mogelijke codonmutaties uitputtend hebben onderzocht, is de grondigheid van de bemonstering zeker voldoende om het soort statistische gevolgtrekkingen te maken over mutatie-effecten die nodig zijn om een ​​kwantitatief evolutionair model te construeren.

De volledigheid waarmee mutaties werden bemonsterd in de mutante plasmiden en virussen, zoals beoordeeld door de tellingen voor elke multinucleotide-codonmutatie in de gecombineerde bibliotheken van (EEN) repliceren A of (B) repliceren B. Door deze plots te beperken tot codonmutaties van meerdere nucleotiden, worden storende effecten van sequentiefouten, die doorgaans codonmutaties van één nucleotide genereren, vermeden. Zeer weinig multinucleotide-codonmutaties worden meer dan eens waargenomen in de niet-gemuteerde controles (DNA, RNA, virus-p1 en virus-p2). Bijna alle multinucleotide codonmutaties worden vele malen waargenomen in de mutante plasmidebibliotheken (mutDNA). Ongeveer de helft van de multinucleotide-codonmutaties wordt minstens vijf keer gevonden in de mutante virussen (mutvirus-p1 en mutvirus-p2), wat aangeeft dat minstens de helft van de mogelijke mutaties in een virus werd ingebouwd. Dit is echter slechts een ondergrens, omdat schadelijke mutaties afwezig zullen zijn in de mutante virussen als gevolg van zuiverende selectie. Als de analyse beperkt is tot synonieme multinucleotide-codonmutaties (die minder waarschijnlijk schadelijk zijn), dan werd meer dan 75% van de mogelijke mutaties in een virus geïncorporeerd. Dit is nog steeds slechts een ondergrens, omdat zelfs synonieme mutaties soms sterk schadelijk zijn voor influenza (Marsh et al. 2008). De volledigheid waarmee aminozuurmutaties worden bemonsterd is hoger vanwege de redundantie van de genetische code. Merk op dat replica A superieur is aan replica B in termen van de volledigheid waarmee de mutaties worden bemonsterd door de mutante virussen. Details van de analyse die is gebruikt om deze cijfers te genereren, zijn te vinden op http://jbloom.github.io/mapmuts/example_2013Analysis_Influenza_NP_Aichi68.html (laatst geraadpleegd op 31 mei 2014).

De volledigheid waarmee mutaties werden bemonsterd in de mutante plasmiden en virussen, zoals beoordeeld door de tellingen voor elke multinucleotide-codonmutatie in de gecombineerde bibliotheken van (EEN) repliceren A of (B) repliceren B. Door deze plots te beperken tot codonmutaties van meerdere nucleotiden, worden storende effecten van sequentiefouten, die doorgaans codonmutaties van één nucleotide genereren, vermeden. Zeer weinig multinucleotide-codonmutaties worden meer dan eens waargenomen in de niet-gemuteerde controles (DNA, RNA, virus-p1 en virus-p2). Bijna alle multinucleotide codonmutaties worden vele malen waargenomen in de mutante plasmidebibliotheken (mutDNA). Ongeveer de helft van de multinucleotide-codonmutaties wordt ten minste vijf keer gevonden in de mutante virussen (mutvirus-p1 en mutvirus-p2), wat aangeeft dat ten minste de helft van de mogelijke mutaties in een virus is ingebouwd. Dit is echter slechts een ondergrens, omdat schadelijke mutaties afwezig zullen zijn in de mutante virussen als gevolg van zuiverende selectie. Als de analyse beperkt is tot synonieme multinucleotide-codonmutaties (die minder waarschijnlijk schadelijk zijn), dan werd meer dan 75% van de mogelijke mutaties in een virus geïncorporeerd. Dit is nog steeds slechts een ondergrens, omdat zelfs synonieme mutaties soms sterk schadelijk zijn voor influenza (Marsh et al. 2008). De volledigheid waarmee aminozuurmutaties worden bemonsterd is hoger vanwege de redundantie van de genetische code. Merk op dat replica A superieur is aan replica B in termen van de volledigheid waarmee de mutaties worden bemonsterd door de mutante virussen. Details van de analyse die is gebruikt om deze cijfers te genereren, zijn te vinden op http://jbloom.github.io/mapmuts/example_2013Analysis_Influenza_NP_Aichi68.html (laatst geraadpleegd op 31 mei 2014).

Inferentie van sitespecifieke aminozuurvoorkeuren

Kwalitatief is het duidelijk dat veranderingen in mutatiefrequenties tussen de plasmidemutantbibliotheken en de resulterende mutante virussen selectie weerspiegelen. Het is echter minder voor de hand liggend hoe deze informatie kwantitatief moet worden geanalyseerd. Selectie werkt op de volledige genomen van alle virussen in de populatie. Daarentegen meten de experimenten alleen plaatsonafhankelijke mutatiefrequenties gemiddeld over de populatie. Hier heb ik deze gegevens geanalyseerd door aan te nemen dat elke site een inherente voorkeur heeft voor elk mogelijk aminozuur. De motivatie om heterogene maar plaatsonafhankelijke aminozuurvoorkeuren voor te stellen, komt van experimenten die suggereren dat de dominante beperking op mutaties die fixeren tijdens NP-evolutie verband houdt met eiwitstabiliteit (Gong et al. 2013) en dat mutatie-effecten op stabiliteit meestal behouden blijven in een site-onafhankelijke manier (Ashenberg et al. 2013). Omdat de experimenten in het algemeen elke mutatie onderzoeken in combinatie met verschillende andere mutaties (de gemiddelde kloon heeft tussen de twee en drie codonmutaties fig. 1), zijn de plaatsspecifieke aminozuurvoorkeuren niet eenvoudig selectiecoëfficiënten voor specifieke mutaties. In plaats daarvan weerspiegelen ze het effect van elke mutatie gemiddeld over een reeks genetische achtergronden.

Laten we in het bijzonder de voorkeur van de site aangeven R voor aminozuur een, met . Figuur 3 geeft aan dat de meeste waargenomen mutaties het resultaat zijn van de gewenste codonmutagenese, maar dat er ook een laag aantal schijnbare mutaties is die voortkomen uit Illumina-sequencingfouten en reverse transcriptie. De verwachte frequentie FR,x van gemuteerd codon x op locatie R in de mutante virussen is gerelateerd aan de voorkeur voor het gecodeerde aminozuur door waar μR,x is de frequentie die site R is gemutageniseerd tot codon x in de plasmidemutantbibliotheek, εR,x is de frequentie waarmee de site ten onrechte wordt geïdentificeerd x tijdens het rangschikken, ρR,x is de frequentie waarnaar de site wordt gemuteerd x tijdens reverse transcriptie, ja wordt opgeteld over alle codons en de kans dat een site meerdere mutaties of fouten in dezelfde kloon ervaart, wordt als verwaarloosbaar klein beschouwd. De waargenomen codontellingen zijn multinomiaal verdeeld rond deze verwachte frequenties, dus door een symmetrische Dirichlet-verdeling te plaatsen voorafgaand aan en gezamenlijk de fout te schatten (εR,x en ρR,x) en mutatie (μR,x) tarieven van de juiste monsters in figuur 2, is het mogelijk om het achterste gemiddelde voor alle aminozuurvoorkeuren af ​​te leiden door Markov-keten Monte Carlo (MCMC, zie Materialen en Methoden).

Een basiscontrole van de consistentie van de algehele experimentele en computationele benadering is om de aminozuurvoorkeuren te vergelijken die zijn afgeleid van verschillende replica's of verschillende virale passages van dezelfde replica. Figuur 5EEN en B toont aan dat de voorkeuren die worden afgeleid uit de eerste en tweede virale passages binnen elk replicaat zeer vergelijkbaar zijn, wat aangeeft dat de meeste selectie plaatsvindt tijdens de initiële virale creatie en passage en dat technische variatie (voorbereiding van monsters, stochasticiteit in sequencing, enz.) weinig impact heeft. Een meer cruciale vergelijking is tussen de voorkeuren afgeleid van de twee onafhankelijke experimentele replica's. Deze vergelijking (afb. 5C) laat zien dat voorkeuren van de onafhankelijke replica's substantieel maar minder perfect gecorreleerd zijn - waarschijnlijk is de imperfecte correlatie omdat de mutante virussen die onafhankelijk van elkaar in elke replica door reverse genetica zijn gecreëerd, verschillende onvolledige monsters zijn van de vele klonen in de plasmidemutantbibliotheken. Desalniettemin laat de substantiële correlatie tussen replica's zien dat de steekproef voldoende is om inherente voorkeuren duidelijk te onthullen, ondanks deze experimentele onvolkomenheden. Vermoedelijk kunnen betere conclusies worden getrokken door gegevens te aggregeren door middel van het middelen van de voorkeuren van beide replica's. Figuur 5NS toont dergelijke gemiddelde voorkeuren vanaf de eerste passage van beide replica's. Deze voorkeuren komen overeen met bestaande kennis over NP-functie en stabiliteit. Bij de geconserveerde residuen in de RNA-bindingsinterface van NP (Ye et al. 2006), bijvoorbeeld, zijn de aminozuren die in natuurlijke sequenties worden gevonden, degenen met de hoogste voorkeuren (tabel 4). Evenzo heeft het stabiliserende aminozuur de hogere voorkeur voor mutaties waarvan experimenteel is gekarakteriseerd dat ze grote effecten hebben op de NP-eiwitstabiliteit (Ashenberg et al. 2013 Gong et al. 2013).

Aminozuurvoorkeuren. (EEN) en (B) Voorkeuren afgeleid uit passages 1 en 2 zijn vergelijkbaar binnen elke replica, wat aangeeft dat de meeste selectie plaatsvindt tijdens de initiële virale creatie en passage en dat de technische variatie klein is. (C) Voorkeuren van de twee onafhankelijke replica's zijn ook gecorreleerd, maar minder perfect. De verhoogde variatie is vermoedelijk te wijten aan stochastiek tijdens de onafhankelijke virale creatie van plasmiden voor elke replica. (NS) Voorkeuren voor alle locaties in NP (de N-terminale Met was niet gemutageniseerd) afgeleid uit passage 1 van de gecombineerde replica's. De hoogte van de letters is evenredig met de voorkeur voor dat aminozuur en wordt gekleurd door hydrofobiciteit. RSA en secundaire structuur worden over elkaar gelegd voor residuen in de kristalstructuur. Correlatiegrafieken tonen Pearson's R en P waarde. Numerieke gegevens voor (NS) bevinden zich in aanvullend bestand S1, aanvullend materiaal online. De voorkeuren komen overeen met bestaande kennis over mutaties naar NP (tabellen 4 en 5). De computercode die is gebruikt om dit cijfer te genereren, is te vinden op http://jbloom.github.io/mapmuts/example_2013Analysis_Influenza_NP_Aichi68.html (laatst geraadpleegd op 31 mei 2014).

Aminozuurvoorkeuren. (EEN) en (B) Voorkeuren afgeleid uit passages 1 en 2 zijn vergelijkbaar binnen elke replica, wat aangeeft dat de meeste selectie plaatsvindt tijdens de initiële virale creatie en passage en dat de technische variatie klein is. (C) Voorkeuren van de twee onafhankelijke replica's zijn ook gecorreleerd, maar minder perfect. De verhoogde variatie is vermoedelijk te wijten aan stochastiek tijdens de onafhankelijke virale creatie van plasmiden voor elke replica. (NS) Voorkeuren voor alle locaties in NP (de N-terminale Met was niet gemutageniseerd) afgeleid uit passage 1 van de gecombineerde replica's. De hoogte van de letters is evenredig met de voorkeur voor dat aminozuur en wordt gekleurd door hydrofobiciteit. RSA en secundaire structuur worden over elkaar gelegd voor residuen in de kristalstructuur. Correlatiegrafieken tonen Pearson's R en P waarde. Numerieke gegevens voor (NS) bevinden zich in aanvullend bestand S1, aanvullend materiaal online. De voorkeuren komen overeen met bestaande kennis over mutaties naar NP (tabellen 4 en 5). De computercode die is gebruikt om dit cijfer te genereren, is te vinden op http://jbloom.github.io/mapmuts/example_2013Analysis_Influenza_NP_Aichi68.html (laatst geraadpleegd op 31 mei 2014).

Voor residuen die betrokken zijn bij de RNA-bindende groef van NP, correleren de voorkeuren en verwachte evolutionaire evenwichtsfrequenties van de experimenten goed met de aminozuurfrequenties in natuurlijk voorkomende sequenties.

residu . Frequenties in natuurlijke sequenties. Experimenteel gemeten aminozuurvoorkeuren. Verwachte Equilibrium Evolutionaire Frequenties van Experimenten.
65 R (0,83), K (0,17) R (0,40), K (0,10), N (0,06) R (0,58), S (0,07)
150 € (1.00) R (0,46), K (0,06), P (0,05), L (0,05) R (0,63), L (0,07)
152 € (1.00) R (0,52), K (0,07), Q (0,07) € (0,71)
156 € (1.00) R (0,52), Q (0,06) R (0,69), S (0,06)
174 € (1.00) R (0,58), N (0,06), T (0,05) € (0,75)
175 € (1.00) R (0,46), K (0,16) R (0,66), K (0,08), S (0,05)
195 € (1.00) € (0,51) € (0,69)
199 € (1.00) R (0,44), M (0,08), Y (0,06), V (0,05) R (0,64), V (0,05)
213 € (1.00) R (0,51), N (0,06) € (0,69)
214 R (0,72), K (0,28) K (0,24), H (0,09), R (0,09), Q (0,08), M (0,06), N (0,06), A (0,06), I (0,06) R (0,19), K (0,17), A (0,09), H (0,07), I (0,06), L (0,06), Q (0,06)
221 € (1.00) R (0,46), E (0,07), K (0,07) R (0,66), L (0,05)
236 R (0,94), K (0,06) K (0,32), R (0,30) R (0,51), K (0,18)
355 € (1.00) R (0,29), L (0,13), K (0,09) R (0,43), L (0,19)
357 K (0,56), Q (0,44) K (0,38), E (0,09), N (0,07), Y (0,05) K (0,31), R (0,09), E (0,08), N (0,06)
361 € (1.00) R (0,53), V (0,13) R (0,68), V (0,11)
391 € (1.00) R (0,59), K (0,09) R (0,77)
148 J (1.00) J (0,54), ik (0,06) Y (0,44), I (0,07), T (0,07), P (0,06), S (0,06)
residu . Frequenties in natuurlijke sequenties. Experimenteel gemeten aminozuurvoorkeuren. Verwachte Equilibrium Evolutionaire Frequenties van Experimenten.
65 R (0,83), K (0,17) R (0,40), K (0,10), N (0,06) R (0,58), S (0,07)
150 € (1.00) R (0,46), K (0,06), P (0,05), L (0,05) R (0,63), L (0,07)
152 € (1.00) R (0,52), K (0,07), Q (0,07) € (0,71)
156 € (1.00) R (0,52), Q (0,06) R (0,69), S (0,06)
174 € (1.00) R (0,58), N (0,06), T (0,05) € (0,75)
175 € (1.00) R (0,46), K (0,16) R (0,66), K (0,08), S (0,05)
195 € (1.00) € (0,51) € (0,69)
199 € (1.00) R (0,44), M (0,08), Y (0,06), V (0,05) R (0,64), V (0,05)
213 € (1.00) R (0,51), N (0,06) € (0,69)
214 R (0,72), K (0,28) K (0,24), H (0,09), R (0,09), Q (0,08), M (0,06), N (0,06), A (0,06), I (0,06) R (0,19), K (0,17), A (0,09), H (0,07), I (0,06), L (0,06), Q (0,06)
221 € (1.00) R (0,46), E (0,07), K (0,07) R (0,66), L (0,05)
236 R (0,94), K (0,06) K (0,32), R (0,30) R (0,51), K (0,18)
355 € (1.00) R (0,29), L (0,13), K (0,09) R (0,43), L (0,19)
357 K (0,56), Q (0,44) K (0,38), E (0,09), N (0,07), Y (0,05) K (0,31), R (0,09), E (0,08), N (0,06)
361 € (1.00) R (0,53), V (0,13) R (0,68), V (0,11)
391 € (1.00) R (0,59), K (0,09) R (0,77)
148 J (1.00) J (0,54), ik (0,06) Y (0,44), I (0,07), T (0,07), P (0,06), S (0,06)

Noot.- Getoond worden de 17 residuen in de NP-RNA-bindende groef in Ye et al. (2006). De tweede kolom geeft de frequenties van aminozuren in alle 21.108 volledige NP-sequenties van influenza A (exclusief vleermuislijnen) in de Influenza Virus Resource per 31 januari 2014. De derde kolom geeft de experimenteel gemeten aminozuurvoorkeuren (fig. 5NS). De vierde kolom geeft de verwachte evolutionaire evenwichtsfrequentie van de aminozuren (fig. 6). Alleen residuen met frequenties of voorkeuren worden vermeld. In alle gevallen heeft het meest voorkomende aminozuur in de natuurlijke sequenties de hoogste verwachte evolutionaire evenwichtsfrequentie. In 15 van de 17 gevallen heeft het meest voorkomende aminozuur in de natuurlijke sequenties de hoogste experimenteel gemeten voorkeur - in de andere twee gevallen is het meest voorkomende aminozuur in de natuurlijke sequenties een van die met de hoogste voorkeur.

Voor residuen die betrokken zijn bij de RNA-bindende groef van NP, correleren de voorkeuren en verwachte evolutionaire evenwichtsfrequenties van de experimenten goed met de aminozuurfrequenties in natuurlijk voorkomende sequenties.

residu . Frequenties in natuurlijke sequenties. Experimenteel gemeten aminozuurvoorkeuren. Verwachte Equilibrium Evolutionaire Frequenties van Experimenten.
65 R (0,83), K (0,17) R (0,40), K (0,10), N (0,06) R (0,58), S (0,07)
150 € (1.00) R (0,46), K (0,06), P (0,05), L (0,05) R (0,63), L (0,07)
152 € (1.00) R (0,52), K (0,07), Q (0,07) € (0,71)
156 € (1.00) R (0,52), Q (0,06) R (0,69), S (0,06)
174 € (1.00) R (0,58), N (0,06), T (0,05) € (0,75)
175 € (1.00) R (0,46), K (0,16) R (0,66), K (0,08), S (0,05)
195 € (1.00) € (0,51) € (0,69)
199 € (1.00) R (0,44), M (0,08), Y (0,06), V (0,05) R (0,64), V (0,05)
213 € (1.00) R (0,51), N (0,06) € (0,69)
214 R (0,72), K (0,28) K (0,24), H (0,09), R (0,09), Q (0,08), M (0,06), N (0,06), A (0,06), I (0,06) R (0,19), K (0,17), A (0,09), H (0,07), I (0,06), L (0,06), Q (0,06)
221 € (1.00) R (0,46), E (0,07), K (0,07) R (0,66), L (0,05)
236 R (0,94), K (0,06) K (0,32), R (0,30) R (0,51), K (0,18)
355 € (1.00) R (0,29), L (0,13), K (0,09) R (0,43), L (0,19)
357 K (0,56), Q (0,44) K (0,38), E (0,09), N (0,07), Y (0,05) K (0,31), R (0,09), E (0,08), N (0,06)
361 € (1.00) R (0,53), V (0,13) R (0,68), V (0,11)
391 € (1.00) R (0,59), K (0,09) R (0,77)
148 J (1.00) J (0,54), ik (0,06) Y (0,44), I (0,07), T (0,07), P (0,06), S (0,06)
residu . Frequenties in natuurlijke sequenties. Experimenteel gemeten aminozuurvoorkeuren. Verwachte Equilibrium Evolutionaire Frequenties van Experimenten.
65 R (0,83), K (0,17) R (0,40), K (0,10), N (0,06) R (0,58), S (0,07)
150 € (1.00) R (0,46), K (0,06), P (0,05), L (0,05) R (0,63), L (0,07)
152 € (1.00) R (0,52), K (0,07), Q (0,07) € (0,71)
156 € (1.00) R (0,52), Q (0,06) R (0,69), S (0,06)
174 € (1.00) R (0,58), N (0,06), T (0,05) € (0,75)
175 € (1.00) R (0,46), K (0,16) R (0,66), K (0,08), S (0,05)
195 € (1.00) € (0,51) € (0,69)
199 € (1.00) R (0,44), M (0,08), Y (0,06), V (0,05) R (0,64), V (0,05)
213 € (1.00) R (0,51), N (0,06) € (0,69)
214 R (0,72), K (0,28) K (0,24), H (0,09), R (0,09), Q (0,08), M (0,06), N (0,06), A (0,06), I (0,06) R (0,19), K (0,17), A (0,09), H (0,07), I (0,06), L (0,06), Q (0,06)
221 € (1.00) R (0,46), E (0,07), K (0,07) R (0,66), L (0,05)
236 R (0,94), K (0,06) K (0,32), R (0,30) R (0,51), K (0,18)
355 € (1.00) R (0,29), L (0,13), K (0,09) R (0,43), L (0,19)
357 K (0,56), Q (0,44) K (0,38), E (0,09), N (0,07), Y (0,05) K (0,31), R (0,09), E (0,08), N (0,06)
361 € (1.00) R (0,53), V (0,13) R (0,68), V (0,11)
391 € (1.00) R (0,59), K (0,09) R (0,77)
148 J (1.00) J (0,54), ik (0,06) Y (0,44), I (0,07), T (0,07), P (0,06), S (0,06)

Noot.- Getoond worden de 17 residuen in de NP-RNA-bindende groef in Ye et al. (2006). De tweede kolom geeft de frequenties van aminozuren in alle 21.108 volledige NP-sequenties van influenza A (exclusief vleermuislijnen) in de Influenza Virus Resource per 31 januari 2014. De derde kolom geeft de experimenteel gemeten aminozuurvoorkeuren (fig. 5NS). De vierde kolom geeft de verwachte evolutionaire evenwichtsfrequentie van de aminozuren (fig. 6). Alleen residuen met frequenties of voorkeuren worden vermeld. In alle gevallen heeft het meest voorkomende aminozuur in de natuurlijke sequenties de hoogste verwachte evolutionaire evenwichtsfrequentie. In 15 van de 17 gevallen heeft het meest voorkomende aminozuur in de natuurlijke sequenties de hoogste experimenteel gemeten voorkeur - in de andere twee gevallen is het meest voorkomende aminozuur in de natuurlijke sequenties een van die met de hoogste voorkeur.

Voor residuen waarvan eerder werd gekarakteriseerd dat mutaties grote effecten hebben op de stabiliteit van de A/Aichi/2/1968 NP, heeft het stabielere aminozuur een hogere voorkeur en komt het ook vaker voor in werkelijke NP-sequenties.

residu . Stabiliteitsmeting . Frequenties in natuurlijke sequenties. Experimenteel gemeten aminozuurvoorkeuren. Verwachte Equilibrium Evolutionaire Frequenties van Experimenten.
259 L259S destabiliseert ( ) L (0,98), S (0,02) L (0,23), S (0,04) L (0,36), S (0,06)
280 V280A destabiliseert ( ) V (0,89), A (0,10) V (0,19), EEN (0,02) V (0,25), EEN (0,03)
334 N334H stabiliseert ( ) H (0,93), N (0,07) H (0,28), N (0,12) H (0,23), N (0,10)
384 R384G destabiliseert ( ) R (0,80), G (0,17) R (0,22), G (0,04) R (0,39), G (0,04)
residu . Stabiliteitsmeting . Frequenties in natuurlijke sequenties. Experimenteel gemeten aminozuurvoorkeuren. Verwachte evenwichts-evolutiefrequenties van experimenten.
259 L259S destabiliseert ( ) L (0,98), S (0,02) L (0,23), S (0,04) L (0,36), S (0,06)
280 V280A destabiliseert ( ) V (0,89), A (0,10) V (0,19), EEN (0,02) V (0,25), EEN (0,03)
334 N334H stabiliseert ( ) H (0,93), N (0,07) H (0,28), N (0,12) H (0,23), N (0,10)
384 R384G destabiliseert ( ) R (0,80), G (0,17) R (0,22), G (0,04) R (0,39), G (0,04)

Noot.—De tweede kolom geeft de experimenteel gemeten verandering in smelttemperatuur (Δtm) geïnduceerd door de mutatie naar de A/Aichi/2/1968 NP zoals gemeten in (Gong et al. 2013) deze mutatie-effecten op de stabiliteit zijn grotendeels geconserveerd in andere NP's (Ashenberg et al. 2013). De derde kolom geeft de frequenties van de aminozuren in alle 21.108 NP-sequenties van volledige lengte van influenza A (exclusief vleermuislijnen) in de Influenza Virus Resource per 31 januari 2014. De vierde kolom geeft de experimenteel gemeten aminozuurvoorkeuren (fig. 5NS). De vijfde kolom geeft de verwachte evolutionaire evenwichtsfrequentie van de aminozuren (fig. 6).

Voor residuen waarvan eerder werd gekarakteriseerd dat mutaties grote effecten hebben op de stabiliteit van de A/Aichi/2/1968 NP, heeft het stabielere aminozuur een hogere voorkeur en komt het ook vaker voor in werkelijke NP-sequenties.

residu . Stabiliteitsmeting . Frequenties in natuurlijke sequenties. Experimenteel gemeten aminozuurvoorkeuren. Verwachte Equilibrium Evolutionaire Frequenties van Experimenten.
259 L259S destabiliseert ( ) L (0,98), S (0,02) L (0,23), S (0,04) L (0,36), S (0,06)
280 V280A destabiliseert ( ) V (0,89), A (0,10) V (0,19), EEN (0,02) V (0,25), EEN (0,03)
334 N334H stabiliseert ( ) H (0,93), N (0,07) H (0,28), N (0,12) H (0,23), N (0,10)
384 R384G destabiliseert ( ) R (0,80), G (0,17) R (0,22), G (0,04) R (0,39), G (0,04)
residu . Stabiliteitsmeting . Frequenties in natuurlijke sequenties. Experimenteel gemeten aminozuurvoorkeuren. Verwachte evenwichts-evolutiefrequenties van experimenten.
259 L259S destabiliseert ( ) L (0,98), S (0,02) L (0,23), S (0,04) L (0,36), S (0,06)
280 V280A destabiliseert ( ) V (0,89), A (0,10) V (0,19), EEN (0,02) V (0,25), EEN (0,03)
334 N334H stabiliseert ( ) H (0,93), N (0,07) H (0,28), N (0,12) H (0,23), N (0,10)
384 R384G destabiliseert ( ) R (0,80), G (0,17) R (0,22), G (0,04) R (0,39), G (0,04)

Noot.—De tweede kolom geeft de experimenteel gemeten verandering in smelttemperatuur (Δtm) geïnduceerd door de mutatie naar de A/Aichi/2/1968 NP zoals gemeten in (Gong et al. 2013) deze mutatie-effecten op de stabiliteit zijn grotendeels geconserveerd in andere NP's (Ashenberg et al. 2013). De derde kolom geeft de frequenties van de aminozuren in alle 21.108 NP-sequenties van volledige lengte van influenza A (exclusief vleermuislijnen) in de Influenza Virus Resource per 31 januari 2014. De vierde kolom geeft de experimenteel gemeten aminozuurvoorkeuren (fig. 5NS). De vijfde kolom geeft de verwachte evolutionaire evenwichtsfrequentie van de aminozuren (fig. 6).

Het experimenteel bepaalde evolutionaire model

De laatste stap is om de aminozuurvoorkeuren te gebruiken om de fixatiekansen te schatten FR,xy, die vervolgens kunnen worden gecombineerd met de mutatiesnelheden om een ​​volledig experimenteel bepaald evolutionair model te creëren. Intuïtief is het duidelijk dat de aminozuurvoorkeuren informatie geven over de fixatiekansen. Het lijkt bijvoorbeeld redelijk om te verwachten dat een mutatie van x tot ja op locatie R zal eerder repareren (relatief grotere waarde van FR,xy) als aminozuur de voorkeur heeft boven deze plaats (als ) en minder waarschijnlijk als ⁠ . De exacte relatie tussen de aminozuurvoorkeuren en de fixatiekansen is echter onduidelijk. Een rigoureuze afleiding zou kennis vereisen van onbekende en waarschijnlijk onmeetbare populatiegenetische parameters voor zowel het diepe mutatiescanexperiment als de natuurlijk evoluerende populaties die aanleiding gaven tot de sequenties die fylogenetisch werden geanalyseerd. In plaats daarvan geef ik twee heuristische relaties. Beide relaties voldoen aan gedetailleerd evenwicht (omkeerbaarheid), zodat ⁠ , wat betekent dat FR,xy definieert een Markov-proces dat evenredig is met zijn stationaire toestand wanneer alle aminozuuruitwisselingen even waarschijnlijk zijn.

Gegeven een van deze definities voor de fixatiewaarschijnlijkheden en de mutatiesnelheden gedefinieerd door vergelijking (2), wordt het experimenteel bepaalde evolutionaire model gedefinieerd door vergelijking (1). Voor de mutatiesnelheden en fixatiewaarschijnlijkheden die hier worden gebruikt, definieert dit evolutionaire model een stochastisch proces met een unieke stationaire toestand voor elke site R. Deze stationaire toestanden geven de verwachte aminozuurfrequenties bij evolutionair evenwicht. Deze evolutionaire evenwichtsfrequenties worden getoond in figuur 6 en verschillen enigszins van de aminozuurvoorkeuren omdat ze ook afhangen van de structuur van de genetische code (en de mutatiesnelheden wanneer deze niet-symmetrisch zijn). Als arginine en lysine bijvoorbeeld gelijke voorkeuren hebben op een plaats, zal arginine evolutionair overvloediger zijn omdat het meer codons heeft.

De verwachte frequenties van de aminozuren bij evolutionair evenwicht met behulp van het experimenteel bepaalde evolutionaire model uit passage 1 van de gecombineerde replica's en vergelijking (3) voor de fixatiewaarschijnlijkheden. Merk op dat deze verwachte frequenties iets anders zijn dan de aminozuurvoorkeuren in figuur 5.NS vanwege de structuur van de genetische code. Wanneer arginine en lysine bijvoorbeeld gelijke voorkeuren hebben op een plaats, zal arginine de neiging hebben om een ​​hogere evolutionaire evenwichtsfrequentie te hebben omdat het door meer codons wordt gecodeerd. De numerieke gegevens staan ​​in aanvullend bestand S2, aanvullend materiaal online. De computercode die is gebruikt om deze plot te genereren, staat op http://jbloom.github.io/phyloExpCM/example_2013Analysis_Influenza_NP_Human_1918_Descending.html (laatst geraadpleegd op 31 mei 2014).

De verwachte frequenties van de aminozuren bij evolutionair evenwicht met behulp van het experimenteel bepaalde evolutionaire model uit passage 1 van de gecombineerde replica's en vergelijking (3) voor de fixatiewaarschijnlijkheden. Merk op dat deze verwachte frequenties iets anders zijn dan de aminozuurvoorkeuren in figuur 5.NS vanwege de structuur van de genetische code. Wanneer arginine en lysine bijvoorbeeld gelijke voorkeuren hebben op een plaats, zal arginine de neiging hebben om een ​​hogere evolutionaire evenwichtsfrequentie te hebben omdat het door meer codons wordt gecodeerd. De numerieke gegevens staan ​​in aanvullend bestand S2, aanvullend materiaal online. De computercode die is gebruikt om deze plot te genereren, is te vinden op http://jbloom.github.io/phyloExpCM/example_2013Analysis_Influenza_NP_Human_1918_Descending.html (laatst geraadpleegd op 31 mei 2014).

Fylogenetische analyses

Het experimenteel bepaalde evolutionaire model kan worden gebruikt om fylogenetische waarschijnlijkheden te berekenen, waardoor vergelijking met bestaande modellen mogelijk wordt. Om deze vergelijkingen uit te voeren, heb ik eerst codonPhyML (Gil et al. 2013) gebruikt om bomen met maximale waarschijnlijkheid (fig. 7) voor NP-sequenties van menselijke griep af te leiden met behulp van de Goldman-Yang (GY94) (Goldman en Yang 1994) en de Kosiol et al. (2007, KOSI07+F) modellen voor codonsubstitutie. Deze boomtopologieën werden vervolgens vastgesteld en de vertakkingslengtes en modelparameters werden geoptimaliseerd met maximale waarschijnlijkheid voor elk van de modellen.

Fylogenetische boom van NP's van menselijke griep stamt af van een naaste verwant van het 1918-virus. Zwart: H1N1 uit 1918 afstamming groen: seizoensgebonden H1N1 rood: H2N2 blauw: H3N2. Maximale waarschijnlijkheid bomen geconstrueerd met behulp van codonPhyML (Gil et al. 2013) met (EEN) het GY94-substitutiemodel of (B) het KOSI07+F vervangingsmodel. Er werden maximaal drie NP-reeksen per jaar van elk subtype gebruikt om de boom te bouwen. De A/Aichi/2/1968 NP die het onderwerp van dit experiment was, was niet een van de NP-reeksen die willekeurig werden gesubsampled voor de boom, dus de naam wordt aangegeven in de buurt van een bijna identieke reeks die in de boom wordt getoond. De computercode die is gebruikt om deze boom te genereren, is te vinden op http://jbloom.github.io/phyloExpCM/example_2013Analysis_Influenza_NP_Human_1918_Descending.html (laatst geraadpleegd op 31 mei 2014).

Fylogenetische boom van NP's van menselijke griep stamt af van een naaste verwant van het 1918-virus. Zwart: H1N1 uit 1918 afstamming groen: seizoensgebonden H1N1 rood: H2N2 blauw: H3N2. Maximale waarschijnlijkheid bomen geconstrueerd met behulp van codonPhyML (Gil et al. 2013) met (EEN) het GY94-substitutiemodel of (B) het KOSI07+F vervangingsmodel. Er werden maximaal drie NP-reeksen per jaar van elk subtype gebruikt om de boom te bouwen. De A/Aichi/2/1968 NP die het onderwerp van dit experiment was, was niet een van de NP-reeksen die willekeurig werden gesubsampled voor de boom, dus de naam wordt aangegeven in de buurt van een bijna identieke reeks die in de boom wordt getoond. De computercode die is gebruikt om deze boom te genereren, is te vinden op http://jbloom.github.io/phyloExpCM/example_2013Analysis_Influenza_NP_Human_1918_Descending.html (laatst geraadpleegd op 31 mei 2014).

Deze modellen verschillen in hun aantal vrije parameters. Een "vrije parameter" is elke variabele met een waarde die wordt bepaald op basis van dezelfde natuurlijk voorkomende NP-sequenties die fylogenetisch worden geanalyseerd. Het experimenteel bepaalde evolutionaire model heeft geen vrije parameters, omdat alle eigenschappen van dit model werden bepaald door experimenten die geen gebruik maakten van informatie van natuurlijk voorkomende NP-sequenties (de aminozuurvoorkeuren worden afgeleid uit de experimenten met behulp van een symmetrische prior, dus in de afwezigheid van experimentele gegevens zouden alle 20 aminozuren worden afgeleid als even geprefereerd op elke plaats). Evenzo, hoewel het KOSI07 + F-model een groot aantal uitwisselbaarheidsvariabelen heeft die empirisch zijn bepaald, zijn deze variabelen geen vrije parameters omdat ze van tevoren zijn gespecificeerd uit analyse van een algemene reeks genhomologen die geen NP omvatten. Zowel GY94 als KOSI07+F bevatten echter ook vrije parameters die worden geschat op basis van de NP-sequenties die fylogenetisch worden geanalyseerd. In de eenvoudigste vorm bevat GY94 11 van dergelijke vrije parameters (negen evenwichtsfrequenties plus overgang-transversie en synoniem-niet-synonieme verhoudingen), terwijl KOSI07+F 62 parameters bevat (60 frequenties plus overgang-transversie en synoniem-niet-synonieme verhoudingen). Complexere varianten voegen parameters toe die variatie in substitutiesnelheid mogelijk maken (Yang 1994) of synoniem-niet-synoniem verhouding tussen sites of geslachten (Yang en Nielsen 1998 Yang et al. 2000). Voor al deze modellen werd HYPHY ( Pond et al. 2005) gebruikt om de waarschijnlijkheid te berekenen na optimalisatie van taklengtes en modelparameters op de vaste boomtopologieën.

Vergelijking van deze waarschijnlijkheden bevestigt opvallend de superioriteit van het experimenteel bepaalde model (tabellen 6 en 7). Het toevoegen van vrije parameters verbetert over het algemeen de aanpassing van een model aan gegevens, en dit geldt voor GY94 en KOSI07+F. Het parametervrije, experimenteel bepaalde evolutionaire model beschrijft echter de sequentie-fylogenie met een waarschijnlijkheid die veel groter is dan zelfs de meest geparametriseerde GY94- en KOSI07+F-varianten. Het interpreteren van de aminozuurvoorkeuren als de fractie van genetische achtergronden die een mutatie tolereren (vgl. 3) presteert beter dan ze te interpreteren als selectiecoëfficiënten (vgl. 4), hoewel beide interpretaties evolutionaire modellen opleveren voor NP die veel beter zijn dan GY94 of KOSI07+F. Vergelijking met behulp van Akaike information content (AIC) om parameters te straffen (Posada en Buckley 2004) benadrukt nog nadrukkelijker de superioriteit van de experimenteel bepaalde modellen.

Waarschijnlijkheden berekend met behulp van verschillende evolutionaire modellen na optimalisatie van de taklengtes voor de vaste boomtopologie afgeleid met behulp van het GY94-model (fig. 7).

Model . AIC . Log Waarschijnlijkheid . Parameters (geoptimaliseerd + empirisch) .
Experimentele, gecombineerde replica's 0.0 −12,338.9 0 (0 + 0)
Experimenteel, repliceer A 67.9 −12,372.8 0 (0 + 0)
Experimenteel, repliceer B 106.1 −12,392.0 0 (0 + 0)
Halpern en Bruno, gecombineerde replica's 357.9 −12,517.9 0 (0 + 0)
Halpern en Bruno, repliceren A 393.0 −12,535.4 0 (0 + 0)
Halpern en Bruno, repliceren B 455.5 −12,566.7 0 (0 + 0)
GY94, bèta ω plus positief, één tarief (M8) 1,136.8 −12,893.3 14 (5 + 9)
GY94, drie categorieën ω, één tarief (M2a) 1,209.5 −12,929.7 14 (5 + 9)
GY94, gamma ω, één tarief (M5) 1,218.0 −12,935.9 12 (3 + 9)
GY94, één ω, gammasnelheden 1,485.7 −13,069.8 12 (3 + 9)
KOSI07+F, drie categorieën ω, één tarief (M2a) 1,679.7 −13,113.8 65 (5 + 60)
KOSI07+F, M8 tarieven-één 1,680.5 −13,114.1 65 (5 + 60)
GY94, één ω, één tarief (M0) 1,754.1 −13,205.0 11 (2 + 9)
KOSI07+F, gamma ω, één tarief 1,757.7 − 13,154.8 63 (3 + 60)
KOSI07+F, één ω, gammasnelheden 1,831.1 −13,191.5 63 (3 + 60)
GY94, branchespecifiek ω, gammasnelheden (M5) 1,972.3 −12,769.1 556 (547 + 9)
KOSI07+F, één ω, één tarief (M0) 2,254.2 −13,404.0 62 (2 + 60)
KOSI07+F, branchespecifiek ω, gammasnelheden 2,319.5 −12,891.7 607 (547 + 60)
Gerandomiseerde experimentele, gecombineerde replica's 3,741.0 −14,209.4 0 (0 + 0)
Gerandomiseerde experimentele, repliceren A 3,809.6 −14,243.7 0 (0 + 0)
Gerandomiseerde experimentele, repliceren B 3,840.4 −14,259.1 0 (0 + 0)
Gerandomiseerde Halpern en Bruno, gecombineerde replica's 4,388.7 −14,533.3 0 (0 + 0)
Gerandomiseerde Halpern en Bruno, repliceren B 4,559.1 −14,618.5 0 (0 + 0)
Gerandomiseerde Halpern en Bruno, repliceren A 4,622.1 −14,649.9 0 (0 + 0)
Model . AIC . Log Waarschijnlijkheid . Parameters (geoptimaliseerd + empirisch) .
Experimentele, gecombineerde replica's 0.0 −12,338.9 0 (0 + 0)
Experimenteel, repliceer A 67.9 −12,372.8 0 (0 + 0)
Experimenteel, repliceer B 106.1 −12,392.0 0 (0 + 0)
Halpern en Bruno, gecombineerde replica's 357.9 −12,517.9 0 (0 + 0)
Halpern en Bruno, repliceren A 393.0 −12,535.4 0 (0 + 0)
Halpern en Bruno, repliceren B 455.5 −12,566.7 0 (0 + 0)
GY94, bèta ω plus positief, één tarief (M8) 1,136.8 −12,893.3 14 (5 + 9)
GY94, drie categorieën ω, één tarief (M2a) 1,209.5 −12,929.7 14 (5 + 9)
GY94, gamma ω, één tarief (M5) 1,218.0 −12,935.9 12 (3 + 9)
GY94, één ω, gammasnelheden 1,485.7 −13,069.8 12 (3 + 9)
KOSI07+F, drie categorieën ω, één tarief (M2a) 1,679.7 −13,113.8 65 (5 + 60)
KOSI07+F, M8 tarieven-één 1,680.5 −13,114.1 65 (5 + 60)
GY94, één ω, één tarief (M0) 1,754.1 −13,205.0 11 (2 + 9)
KOSI07+F, gamma ω, één tarief 1,757.7 − 13,154.8 63 (3 + 60)
KOSI07+F, één ω, gammasnelheden 1,831.1 −13,191.5 63 (3 + 60)
GY94, branchespecifiek ω, gammasnelheden (M5) 1,972.3 −12,769.1 556 (547 + 9)
KOSI07+F, één ω, één tarief (M0) 2,254.2 −13,404.0 62 (2 + 60)
KOSI07+F, branchespecifiek ω, gammasnelheden 2,319.5 −12,891.7 607 (547 + 60)
Gerandomiseerde experimentele, gecombineerde replica's 3,741.0 −14,209.4 0 (0 + 0)
Gerandomiseerde experimentele, repliceren A 3,809.6 −14,243.7 0 (0 + 0)
Gerandomiseerde experimentele, repliceren B 3,840.4 −14,259.1 0 (0 + 0)
Gerandomiseerde Halpern en Bruno, gecombineerde replica's 4,388.7 −14,533.3 0 (0 + 0)
Gerandomiseerde Halpern en Bruno, repliceren B 4,559.1 −14,618.5 0 (0 + 0)
Gerandomiseerde Halpern en Bruno, repliceren A 4,622.1 −14,649.9 0 (0 + 0)

Opmerking .-Experimenteel bepaalde modellen presteren aanzienlijk beter dan GY94 of KOSI07+F. Modellen zijn gesorteerd op ΔAIC (Posada en Buckley 2004), maar merk op dat de experimenteel bepaalde modellen allemaal een veel hogere logwaarschijnlijkheid hebben, zelfs voordat parameters worden bestraft. De experimenteel bepaalde modellen passen het beste als de aminozuurvoorkeuren worden geïnterpreteerd als de fractie van genetische achtergronden die een mutatie tolereren (vgl. 3) in plaats van als selectiecoëfficiënten (vgl. 4). Het randomiseren van de experimenteel bepaalde voorkeuren tussen sites maakt de modellen veel slechter. Alle varianten van GY94 en KOSI07+F bevatten empirische evenwichtsfrequenties plus een overgang-transversieverhouding en synoniem-niet-synoniem-verhouding (ω) geoptimaliseerd door waarschijnlijkheid. Sommige varianten staan ​​toe ω om tussen sites te variëren met behulp van discrete categorieën (M2a), een gammadistributie (M5) of een bètadistributie plus een categorie (M8). Sommige varianten laten een andere ω voor elke vestiging. Bij sommige varianten kan de substitutiesnelheid gamma-gedistribueerd zijn.

Waarschijnlijkheden berekend met behulp van verschillende evolutionaire modellen na optimalisatie van de taklengtes voor de vaste boomtopologie afgeleid met behulp van het GY94-model (fig. 7).

Model . AIC . Log Waarschijnlijkheid . Parameters (geoptimaliseerd + empirisch) .
Experimentele, gecombineerde replica's 0.0 −12,338.9 0 (0 + 0)
Experimenteel, repliceer A 67.9 −12,372.8 0 (0 + 0)
Experimenteel, repliceer B 106.1 −12,392.0 0 (0 + 0)
Halpern en Bruno, gecombineerde replica's 357.9 −12,517.9 0 (0 + 0)
Halpern en Bruno, repliceren A 393.0 −12,535.4 0 (0 + 0)
Halpern en Bruno, repliceren B 455.5 −12,566.7 0 (0 + 0)
GY94, bèta ω plus positief, één tarief (M8) 1,136.8 −12,893.3 14 (5 + 9)
GY94, drie categorieën ω, één tarief (M2a) 1,209.5 −12,929.7 14 (5 + 9)
GY94, gamma ω, één tarief (M5) 1,218.0 −12,935.9 12 (3 + 9)
GY94, één ω, gammasnelheden 1,485.7 −13,069.8 12 (3 + 9)
KOSI07+F, drie categorieën ω, één tarief (M2a) 1,679.7 −13,113.8 65 (5 + 60)
KOSI07+F, M8 tarieven-één 1,680.5 −13,114.1 65 (5 + 60)
GY94, één ω, één tarief (M0) 1,754.1 −13,205.0 11 (2 + 9)
KOSI07+F, gamma ω, één tarief 1,757.7 − 13,154.8 63 (3 + 60)
KOSI07+F, één ω, gammasnelheden 1,831.1 −13,191.5 63 (3 + 60)
GY94, branchespecifiek ω, gammasnelheden (M5) 1,972.3 −12,769.1 556 (547 + 9)
KOSI07+F, één ω, één tarief (M0) 2,254.2 −13,404.0 62 (2 + 60)
KOSI07+F, branchespecifiek ω, gammasnelheden 2,319.5 −12,891.7 607 (547 + 60)
Gerandomiseerde experimentele, gecombineerde replica's 3,741.0 −14,209.4 0 (0 + 0)
Gerandomiseerde experimentele, repliceren A 3,809.6 −14,243.7 0 (0 + 0)
Gerandomiseerde experimentele, repliceren B 3,840.4 −14,259.1 0 (0 + 0)
Gerandomiseerde Halpern en Bruno, gecombineerde replica's 4,388.7 −14,533.3 0 (0 + 0)
Gerandomiseerde Halpern en Bruno, repliceren B 4,559.1 −14,618.5 0 (0 + 0)
Gerandomiseerde Halpern en Bruno, repliceren A 4,622.1 −14,649.9 0 (0 + 0)
Model . AIC . Log Waarschijnlijkheid . Parameters (geoptimaliseerd + empirisch) .
Experimentele, gecombineerde replica's 0.0 −12,338.9 0 (0 + 0)
Experimenteel, repliceer A 67.9 −12,372.8 0 (0 + 0)
Experimenteel, repliceer B 106.1 −12,392.0 0 (0 + 0)
Halpern en Bruno, gecombineerde replica's 357.9 −12,517.9 0 (0 + 0)
Halpern en Bruno, repliceren A 393.0 −12,535.4 0 (0 + 0)
Halpern en Bruno, repliceren B 455.5 −12,566.7 0 (0 + 0)
GY94, bèta ω plus positief, één tarief (M8) 1,136.8 −12,893.3 14 (5 + 9)
GY94, drie categorieën ω, één tarief (M2a) 1,209.5 −12,929.7 14 (5 + 9)
GY94, gamma ω, één tarief (M5) 1,218.0 −12,935.9 12 (3 + 9)
GY94, één ω, gammasnelheden 1,485.7 −13,069.8 12 (3 + 9)
KOSI07+F, drie categorieën ω, één tarief (M2a) 1,679.7 −13,113.8 65 (5 + 60)
KOSI07+F, M8 tarieven-één 1,680.5 −13,114.1 65 (5 + 60)
GY94, één ω, één tarief (M0) 1,754.1 −13,205.0 11 (2 + 9)
KOSI07+F, gamma ω, één tarief 1,757.7 − 13,154.8 63 (3 + 60)
KOSI07+F, één ω, gammasnelheden 1,831.1 −13,191.5 63 (3 + 60)
GY94, branchespecifiek ω, gammasnelheden (M5) 1,972.3 −12,769.1 556 (547 + 9)
KOSI07+F, één ω, één tarief (M0) 2,254.2 −13,404.0 62 (2 + 60)
KOSI07+F, branchespecifiek ω, gammasnelheden 2,319.5 −12,891.7 607 (547 + 60)
Gerandomiseerde experimentele, gecombineerde replica's 3,741.0 −14,209.4 0 (0 + 0)
Gerandomiseerde experimentele, repliceren A 3,809.6 −14,243.7 0 (0 + 0)
Gerandomiseerde experimentele, repliceren B 3,840.4 −14,259.1 0 (0 + 0)
Gerandomiseerde Halpern en Bruno, gecombineerde replica's 4,388.7 −14,533.3 0 (0 + 0)
Gerandomiseerde Halpern en Bruno, repliceren B 4,559.1 −14,618.5 0 (0 + 0)
Gerandomiseerde Halpern en Bruno, repliceren A 4,622.1 −14,649.9 0 (0 + 0)

Opmerking .-Experimenteel bepaalde modellen presteren aanzienlijk beter dan GY94 of KOSI07+F. Modellen zijn gesorteerd op ΔAIC (Posada en Buckley 2004), maar merk op dat de experimenteel bepaalde modellen allemaal een veel hogere logwaarschijnlijkheid hebben, zelfs voordat parameters worden bestraft. De experimenteel bepaalde modellen passen het beste als de aminozuurvoorkeuren worden geïnterpreteerd als de fractie van genetische achtergronden die een mutatie tolereren (vgl. 3) in plaats van als selectiecoëfficiënten (vgl. 4). Het randomiseren van de experimenteel bepaalde voorkeuren tussen sites maakt de modellen veel slechter. Alle varianten van GY94 en KOSI07+F bevatten empirische evenwichtsfrequenties plus een overgang-transversieverhouding en synoniem-niet-synoniem-verhouding (ω) geoptimaliseerd door waarschijnlijkheid. Sommige varianten staan ​​toe ω om tussen sites te variëren met behulp van discrete categorieën (M2a), een gammadistributie (M5) of een bètadistributie plus een categorie (M8). Sommige varianten laten een andere ω voor elke vestiging. Bij sommige varianten kan de substitutiesnelheid gamma-gedistribueerd zijn.

Waarschijnlijkheden voor de verschillende evolutionaire modellen voor de boomtopologie afgeleid met CodonPhyML met behulp van KOSI07 + F.

Model . AIC . Log Waarschijnlijkheid . Parameters (geoptimaliseerd + empirisch) .
Experimentele, gecombineerde replica's 0.0 −12,334.6 0 (0 + 0)
Experimenteel, repliceer A 67.9 −12,368.5 0 (0 + 0)
Experimenteel, repliceer B 106.2 −12,387.7 0 (0 + 0)
Halpern en Bruno, gecombineerde replica's 356.8 −12,513.0 0 (0 + 0)
Halpern en Bruno, repliceren A 391.5 −12,530.3 0 (0 + 0)
Halpern en Bruno, repliceren B 454.8 −12,562.0 0 (0 + 0)
GY94, bèta ω plus positief, één tarief (M8) 1,183.4 −12,912.3 14 (5 + 9)
GY94, drie categorieën ω, één tarief (M2a) 1,209.4 −12,925.3 14 (5 + 9)
GY94, gamma ω, één tarief (M5) 1,219.6 −12,932.4 12 (3 + 9)
GY94, één ω, gammasnelheden 1,493.1 −13,069.1 12 (3 + 9)
KOSI07+F, drie categorieën ω, één tarief (M2a) 1,676.0 −13,107.6 65 (5 + 60)
KOSI07+F, M8 tarieven-één 1,676.6 −13,107.9 65 (5 + 60)
KOSI07+F, gamma ω, één tarief 1,753.3 −13,148.2 63 (3 + 60)
GY94, één ω, één tarief (M0) 1,762.2 −13,204.7 11 (2 + 9)
KOSI07+F, één ω, gammasnelheden 1,834.3 −13,188.7 63 (3 + 60)
GY94, branchespecifiek ω, gammasnelheden (M5) 1,980.8 −12,769.0 556 (547 + 9)
KOSI07+F, één ω, één tarief (M0) 2,256.8 −13,401.0 62 (2 + 60)
KOSI07+F, branchespecifiek ω, gammasnelheden 2,324.0 −12,889.6 607 (547 + 60)
Gerandomiseerde experimentele, gecombineerde replica's 3,741.3 −14,205.2 0 (0 + 0)
Gerandomiseerde experimentele, repliceren A 3,809.4 −14,239.3 0 (0 + 0)
Gerandomiseerde experimentele, repliceren B 3,841.4 −14,255.3 0 (0 + 0)
Gerandomiseerde Halpern en Bruno, gecombineerde replica's 4,387.6 −14,528.4 0 (0 + 0)
Gerandomiseerde Halpern en Bruno, repliceren B 4,557.9 −14,613.6 0 (0 + 0)
Gerandomiseerde Halpern en Bruno, repliceren A 4,620.8 −14,645.0 0 (0 + 0)
Model . AIC . Log Waarschijnlijkheid . Parameters (geoptimaliseerd + empirisch) .
Experimentele, gecombineerde replica's 0.0 −12,334.6 0 (0 + 0)
Experimenteel, repliceer A 67.9 −12,368.5 0 (0 + 0)
Experimenteel, repliceer B 106.2 −12,387.7 0 (0 + 0)
Halpern en Bruno, gecombineerde replica's 356.8 −12,513.0 0 (0 + 0)
Halpern en Bruno, repliceren A 391.5 −12,530.3 0 (0 + 0)
Halpern en Bruno, repliceren B 454.8 −12,562.0 0 (0 + 0)
GY94, bèta ω plus positief, één tarief (M8) 1,183.4 −12,912.3 14 (5 + 9)
GY94, drie categorieën ω, één tarief (M2a) 1,209.4 −12,925.3 14 (5 + 9)
GY94, gamma ω, één tarief (M5) 1,219.6 −12,932.4 12 (3 + 9)
GY94, één ω, gammasnelheden 1,493.1 −13,069.1 12 (3 + 9)
KOSI07+F, drie categorieën ω, één tarief (M2a) 1,676.0 −13,107.6 65 (5 + 60)
KOSI07+F, M8 tarieven-één 1,676.6 −13,107.9 65 (5 + 60)
KOSI07+F, gamma ω, één tarief 1,753.3 −13,148.2 63 (3 + 60)
GY94, één ω, één tarief (M0) 1,762.2 −13,204.7 11 (2 + 9)
KOSI07+F, één ω, gammasnelheden 1,834.3 −13,188.7 63 (3 + 60)
GY94, branchespecifiek ω, gammasnelheden (M5) 1,980.8 −12,769.0 556 (547 + 9)
KOSI07+F, één ω, één tarief (M0) 2,256.8 −13,401.0 62 (2 + 60)
KOSI07+F, branchespecifiek ω, gammasnelheden 2,324.0 −12,889.6 607 (547 + 60)
Gerandomiseerde experimentele, gecombineerde replica's 3,741.3 −14,205.2 0 (0 + 0)
Gerandomiseerde experimentele, repliceren A 3,809.4 −14,239.3 0 (0 + 0)
Gerandomiseerde experimentele, repliceren B 3,841.4 −14,255.3 0 (0 + 0)
Gerandomiseerde Halpern en Bruno, gecombineerde replica's 4,387.6 −14,528.4 0 (0 + 0)
Gerandomiseerde Halpern en Bruno, repliceren B 4,557.9 −14,613.6 0 (0 + 0)
Gerandomiseerde Halpern en Bruno, repliceren A 4,620.8 −14,645.0 0 (0 + 0)

Opmerking .—Deze tabel verschilt van tabel 6 doordat hij de waarschijnlijkheden optimaliseert op de boomtopologie die wordt afgeleid met KOSI07+F in plaats van met GY94.

Waarschijnlijkheden voor de verschillende evolutionaire modellen voor de boomtopologie afgeleid met CodonPhyML met behulp van KOSI07 + F.

Model . AIC . Log Waarschijnlijkheid . Parameters (geoptimaliseerd + empirisch) .
Experimentele, gecombineerde replica's 0.0 −12,334.6 0 (0 + 0)
Experimenteel, repliceer A 67.9 −12,368.5 0 (0 + 0)
Experimenteel, repliceer B 106.2 −12,387.7 0 (0 + 0)
Halpern en Bruno, gecombineerde replica's 356.8 −12,513.0 0 (0 + 0)
Halpern en Bruno, repliceren A 391.5 −12,530.3 0 (0 + 0)
Halpern en Bruno, repliceren B 454.8 −12,562.0 0 (0 + 0)
GY94, bèta ω plus positief, één tarief (M8) 1,183.4 −12,912.3 14 (5 + 9)
GY94, drie categorieën ω, één tarief (M2a) 1,209.4 −12,925.3 14 (5 + 9)
GY94, gamma ω, één tarief (M5) 1,219.6 −12,932.4 12 (3 + 9)
GY94, één ω, gammasnelheden 1,493.1 −13,069.1 12 (3 + 9)
KOSI07+F, drie categorieën ω, één tarief (M2a) 1,676.0 −13,107.6 65 (5 + 60)
KOSI07+F, M8 tarieven-één 1,676.6 −13,107.9 65 (5 + 60)
KOSI07+F, gamma ω, één tarief 1,753.3 −13,148.2 63 (3 + 60)
GY94, één ω, één tarief (M0) 1,762.2 −13,204.7 11 (2 + 9)
KOSI07+F, één ω, gammasnelheden 1,834.3 −13,188.7 63 (3 + 60)
GY94, branchespecifiek ω, gammasnelheden (M5) 1,980.8 −12,769.0 556 (547 + 9)
KOSI07+F, één ω, één tarief (M0) 2,256.8 −13,401.0 62 (2 + 60)
KOSI07+F, branchespecifiek ω, gammasnelheden 2,324.0 −12,889.6 607 (547 + 60)
Gerandomiseerde experimentele, gecombineerde replica's 3,741.3 −14,205.2 0 (0 + 0)
Gerandomiseerde experimentele, repliceren A 3,809.4 −14,239.3 0 (0 + 0)
Gerandomiseerde experimentele, repliceren B 3,841.4 −14,255.3 0 (0 + 0)
Gerandomiseerde Halpern en Bruno, gecombineerde replica's 4,387.6 −14,528.4 0 (0 + 0)
Gerandomiseerde Halpern en Bruno, repliceren B 4,557.9 −14,613.6 0 (0 + 0)
Gerandomiseerde Halpern en Bruno, repliceren A 4,620.8 −14,645.0 0 (0 + 0)
Model . AIC . Log Waarschijnlijkheid . Parameters (geoptimaliseerd + empirisch) .
Experimentele, gecombineerde replica's 0.0 −12,334.6 0 (0 + 0)
Experimenteel, repliceer A 67.9 −12,368.5 0 (0 + 0)
Experimenteel, repliceer B 106.2 −12,387.7 0 (0 + 0)
Halpern en Bruno, gecombineerde replica's 356.8 −12,513.0 0 (0 + 0)
Halpern en Bruno, repliceren A 391.5 −12,530.3 0 (0 + 0)
Halpern en Bruno, repliceren B 454.8 −12,562.0 0 (0 + 0)
GY94, bèta ω plus positief, één tarief (M8) 1,183.4 −12,912.3 14 (5 + 9)
GY94, drie categorieën ω, één tarief (M2a) 1,209.4 −12,925.3 14 (5 + 9)
GY94, gamma ω, één tarief (M5) 1,219.6 −12,932.4 12 (3 + 9)
GY94, één ω, gammasnelheden 1,493.1 −13,069.1 12 (3 + 9)
KOSI07+F, drie categorieën ω, één tarief (M2a) 1,676.0 −13,107.6 65 (5 + 60)
KOSI07+F, M8 tarieven-één 1,676.6 −13,107.9 65 (5 + 60)
KOSI07+F, gamma ω, één tarief 1,753.3 −13,148.2 63 (3 + 60)
GY94, één ω, één tarief (M0) 1,762.2 −13,204.7 11 (2 + 9)
KOSI07+F, één ω, gammasnelheden 1,834.3 −13,188.7 63 (3 + 60)
GY94, branchespecifiek ω, gammasnelheden (M5) 1,980.8 −12,769.0 556 (547 + 9)
KOSI07+F, één ω, één tarief (M0) 2,256.8 −13,401.0 62 (2 + 60)
KOSI07+F, branchespecifiek ω, gammasnelheden 2,324.0 −12,889.6 607 (547 + 60)
Gerandomiseerde experimentele, gecombineerde replica's 3,741.3 −14,205.2 0 (0 + 0)
Gerandomiseerde experimentele, repliceren A 3,809.4 −14,239.3 0 (0 + 0)
Gerandomiseerde experimentele, repliceren B 3,841.4 −14,255.3 0 (0 + 0)
Gerandomiseerde Halpern en Bruno, gecombineerde replica's 4,387.6 −14,528.4 0 (0 + 0)
Gerandomiseerde Halpern en Bruno, repliceren B 4,557.9 −14,613.6 0 (0 + 0)
Gerandomiseerde Halpern en Bruno, repliceren A 4,620.8 −14,645.0 0 (0 + 0)

Opmerking .—Deze tabel verschilt van tabel 6 doordat hij de waarschijnlijkheden op de boomtopologie optimaliseert die zijn afgeleid met KOSI07+F in plaats van met GY94.

Er is ook een duidelijke correlatie tussen de kwaliteit en het volume van experimentele gegevens en de fylogenetische fit: modellen van individuele experimentele replica's geven een lagere waarschijnlijkheid dan beide replica's samen, en de technisch superieure replica A (denk aan de vergelijking in fig. 4) geeft een betere waarschijnlijkheid dan replica B ( tabellen 6 en 7). Dit feit suggereert dat verbeteringen in experimentele methodologie die de nauwkeurigheid van de gemeten mutatie-effecten verbeteren, zouden moeten leiden tot nog betere experimenteel bepaalde evolutionaire modellen.

In tabellen 6 en 7 wordt het plaatsspecifieke, experimenteel bepaalde model vergeleken met varianten van twee algemene modellen (GY94 en KOSI07+F) die globaal voor alle eiwitten gelden.Meer recent is het mogelijk geworden om niet-site-specifieke (identiek over sites) codon- en aminozuurmodellen te schatten met behulp van natuurlijk voorkomende sequenties van specifieke eiwitten of virussen (Dang et al. 2010 De Maio et al. 2013). Men zou zich daarom kunnen afvragen of het experimenteel bepaalde model superieur is omdat het plaatsspecifiek is of simpelweg omdat het experimenteel is afgeleid van diepe mutatiescanning van influenza. Om deze vraag te beantwoorden, heb ik "gerandomiseerde" experimenteel bepaalde modellen gemaakt waarin de diepe mutatiescangegevens willekeurig tussen eiwitsites werden geschud. Deze gerandomiseerde modellen zijn nog steeds afgeleid van diepgaande mutatiescanning van influenza, maar hebben hun koppeling met locatiespecifieke experimentele informatie verloren. Deze gerandomiseerde modellen zijn aanzienlijk inferieur aan alle andere modellen die hier worden beschouwd (tabellen 6 en 7). Daarom is de superioriteit van het experimenteel bepaalde model te danken aan het gebruik van locatiespecifieke informatie van de diepe mutatiescan - als deze locatiespecificiteit verloren gaat, wordt het model veel slechter dan algemene modellen zoals GY94 of KOSI07 + F.


Autotrofen versus heterotrofen

Levende organismen verkrijgen op twee manieren chemische energie.

autotrofen, getoond in Figuur hieronder, slaan chemische energie op in koolhydraatvoedselmoleculen die ze zelf bouwen. Voedsel is chemische energie opgeslagen in organische moleculen. Voedsel levert zowel de energie om werk te doen als de koolstof om lichamen te bouwen. Omdat de meeste autotrofen zonlicht omzetten om voedsel te maken, noemen we het proces dat ze gebruiken fotosynthese. Slechts drie groepen organismen - planten, algen en sommige bacteriën - zijn in staat tot deze levengevende energietransformatie. Autotrofen maken voedsel voor eigen gebruik, maar ze maken ook genoeg om ander leven te ondersteunen. Bijna alle andere organismen zijn absoluut afhankelijk van deze drie groepen voor het voedsel dat ze produceren. De producenten, zoals autotrofen ook bekend zijn, begin voedselketens die al het leven voeden. Voedselketens komen aan bod in het concept "Voedselketens en Voedselwebben".

heterotrofen kunnen hun eigen voedsel niet maken, dus moeten ze het eten of opnemen. Om deze reden zijn heterotrofen ook bekend als: consumenten. Tot de consumenten behoren alle dieren en schimmels en veel protisten en bacteriën. Ze kunnen autotrofen of andere heterotrofen of organische moleculen van andere organismen consumeren. Heterotrofen vertonen een grote diversiteit en kunnen veel fascinerender lijken dan producenten. Maar heterotrofen worden beperkt door onze totale afhankelijkheid van die autotrofen die oorspronkelijk ons ​​voedsel maakten. Als planten, algen en autotrofe bacteriën van de aarde zouden verdwijnen, zouden ook dieren, schimmels en andere heterotrofen spoedig verdwijnen. Al het leven vereist een constante toevoer van energie. Alleen autotrofen kunnen die ultieme zonnebron omzetten in de chemische energie in voedsel die het leven aandrijft, zoals weergegeven in Figuur onderstaand.

Fotosynthetische autotrofen, die voedsel maken met behulp van de energie in zonlicht, omvatten (a) planten, (b) algen en (c) bepaalde bacteriën.

Fotosynthese levert meer dan 99 procent van de energie voor het leven op aarde. Een veel kleinere groep autotrofen - meestal bacteriën in donkere of zuurstofarme omgevingen - produceert voedsel met behulp van de chemische energie die is opgeslagen in anorganische moleculen zoals waterstofsulfide, ammoniak of methaan. Terwijl fotosynthese lichtenergie omzet in chemische energie, brengt deze alternatieve methode om voedsel te maken chemische energie over van anorganische naar organische moleculen. Het heet daarom chemosynthese, en is kenmerkend voor de tubeworms getoond in Figuur onderstaand. Enkele van de meest recent ontdekte chemosynthetische bacteriën leven in warmwateropeningen in de diepzee of "zwarte rokers". Daar gebruiken ze de energie in gassen uit het binnenste van de aarde om voedsel te produceren voor een verscheidenheid aan unieke heterotrofen: gigantische buiswormen, blinde garnalen, gigantische witte krabben en gepantserde slakken. Sommige wetenschappers denken dat chemosynthese ook het leven onder het oppervlak van Mars, de maan van Jupiter, Europa en andere planeten kan ondersteunen. Ecosystemen gebaseerd op chemosynthese lijken misschien zeldzaam en exotisch, maar ook zij illustreren de absolute afhankelijkheid van heterotrofen van autotrofen voor voedsel.

Een voedselketen laat zien hoe energie en materie van producent naar consument stromen. Materie wordt hergebruikt, maar er moet energie in het systeem blijven stromen. Waar komt deze energie vandaan? Hoewel deze voedselketens "eindigen" met ontbinders, verteren ontbinders in feite materie van elk niveau van de voedselketen? (zie het concept "Flow of Energy".)

Tubeworms diep in de Galapagos Rift halen hun energie uit chemosynthetische bacteriën die in hun weefsels leven. Geen spijsvertering nodig!

Eten maken en gebruiken

De stroom van energie door levende organismen begint met fotosynthese. Dit proces slaat energie uit zonlicht op in de chemische bindingen van glucose. Door de chemische bindingen in glucose te verbreken, geven cellen de opgeslagen energie vrij en maken ze de ATP die ze nodig hebben. Het proces waarbij glucose wordt afgebroken en ATP wordt gemaakt heet cellulaire ademhaling.

Fotosynthese en cellulaire ademhaling zijn als twee kanten van dezelfde medaille. Dit blijkt uit Figuur onderstaand. De producten van het ene proces zijn de reactanten van het andere. Samen slaan de twee processen energie op in levende organismen en geven ze deze weer af. De twee processen werken ook samen om zuurstof in de atmosfeer van de aarde te recyclen.

Dit diagram vergelijkt en contrasteert fotosynthese en cellulaire ademhaling. Het laat ook zien hoe de twee processen met elkaar samenhangen.

Fotosynthese

Fotosynthese wordt vaak beschouwd als het belangrijkste levensproces op aarde. Het verandert lichtenergie in chemische energie en geeft ook zuurstof af. Zonder fotosynthese zou er geen zuurstof in de atmosfeer zijn. Fotosynthese omvat veel chemische reacties, maar ze kunnen worden samengevat in een enkele chemische vergelijking:

Fotosynthetische autotrofen vangen lichtenergie van de zon op en absorberen koolstofdioxide en water uit hun omgeving. Met behulp van de lichtenergie combineren ze de reactanten om glucose en zuurstof te produceren, wat een afvalproduct is. Ze slaan de glucose op, meestal als zetmeel, en ze geven de zuurstof af aan de atmosfeer.

Cellulaire ademhaling

Cellulaire ademhaling & ldquo verbrandt & rdquo glucose voor energie. Het produceert echter lichte of intense hitte zoals sommige andere soorten verbranding. Dit komt omdat het de energie in glucose langzaam, in veel kleine stappen, vrijgeeft. Het gebruikt de energie die vrijkomt om ATP-moleculen te vormen. Cellulaire ademhaling omvat veel chemische reacties, die kunnen worden samengevat met deze chemische vergelijking:

Cellulaire ademhaling vindt plaats in de cellen van alle levende wezens. Het vindt plaats in de cellen van zowel autotrofen als heterotrofen. Ze verbranden allemaal glucose om ATP te vormen.


Clinlab-navigator

Precisie is herhaalbaarheid. Precisie geeft aan hoe goed een methode of instrument hetzelfde resultaat geeft wanneer een enkel monster herhaaldelijk wordt getest. Precisie meet de willekeurige fout van een methode, namelijk de spreiding in de gegevens. Precisie geeft niet aan dat een instrument het juiste resultaat rapporteert, namelijk nauwkeurigheid.

Er worden twee soorten precisie gemeten binnen run en tussen run. Precisie binnen een run geeft een optimistische schatting van de verwachte dagelijkse prestaties van een methode of instrument, aangezien er een minimale kans is dat de bedrijfsomstandigheden veranderen tijdens een enkele analytische run. Moet binnen de runnauwkeurigheid worden geëvalueerd en geaccepteerd voordat verder wordt gegaan met uitgebreidere onderzoeken.

Materiaal voor kwaliteitscontrole is in de handel verkrijgbaar. Voor elke analyt moeten ten minste twee en soms drie concentraties materiaal voor kwaliteitscontrole worden uitgevoerd. De concentratie van de analyt in de kwaliteitscontrolemonsters moet zo dicht mogelijk bij de bovenste en onderste medische beslissingspunten liggen. Deze beslissingspunten kunnen de bovenste en onderste referentiewaarden vertegenwoordigen of nationaal aanbevolen beslissingspunten.

Clinical Laboratory Standards Institute beveelt aan om drie keer per run twee niveaus van kwaliteitscontrolemateriaal uit te voeren voor vijf verschillende runs, wat 15 replica's van elk niveau oplevert. De meeste bedrijven voor in-vitrodiagnostiek gebruiken dit protocol wanneer ze een nieuw instrument in een klinisch laboratorium installeren.

Sommige laboratoria zijn van mening dat een goede precisiestudie 20 tot 50 replica's zou moeten omvatten. Hoe groter het aantal replicaties, hoe meer vertrouwen u kunt hebben in de nauwkeurige resultaten. Als de werkelijke SD van een methode bijvoorbeeld 1,00 is, kan een precisieschatting op basis van 20 replicaties variëren van 0,76 tot 1,46. De precisieschatting op basis van 50 replica's is smaller, variërend van 0,84 tot 1,24.

Gemiddelde, standaarddeviatie (SD) en variatiecoëfficiënt (CV) worden berekend voor elk niveau met behulp van een spreadsheet.

  • Gemiddelde is de gemiddelde waarde, die wordt berekend door de resultaten op te tellen en te delen door het totale aantal resultaten.
  • SD is de primaire maatstaf voor de spreiding of variatie van de individuele resultaten over de gemiddelde waarde. De eenvoudigste manier om SD te berekenen, is door de statistische hulpmiddelen te gebruiken die aanwezig zijn in een spreadsheet zoals Excel. Hoe groter de onnauwkeurigheid, hoe groter de standaarddeviatie zal zijn. Voor veel analyten varieert SD met de monsterconcentratie. Als we glucose als voorbeeld nemen, duidt een SD van 10 voor een monster van 400 mg/dL op een zeer goede precisie, maar een SD van 10 voor een monster van 40 mg/dL staat voor een zeer slechte precisie.
  • CV is de SD uitgedrukt als een percentage van het gemiddelde (CV = standaarddeviatie/gemiddelde x 100). Hoe hoger de standaarddeviatie, hoe groter het percentage van het gemiddelde en hoe hoger het %CV.
  • Het 95%-betrouwbaarheidsinterval voor SD is een maat voor de precisie van de precisieschatting. De breedte van het betrouwbaarheidsinterval hangt af van het aantal geanalyseerde monsters en de intrinsieke SD van de methode.

Als een instrument of methode een goede nauwkeurigheid heeft, moet 95% van de waarden binnen 2 standaarddeviaties van het gemiddelde vallen. Dat betekent dat niet meer dan 1 van de 20 resultaten buiten 2 standaarddeviaties mag vallen.

Berekende SD en CV moeten worden vergeleken met de door de fabrikant gepubliceerde statistieken. Indien de verkregen resultaten hoger zijn dan de claim van de fabrikant, dient een onderzoek plaats te vinden alvorens verder te gaan met de methode-evaluatie.

Hieronder ziet u een voorbeeld van precisie binnen de run voor materiaal voor kwaliteitscontrole van niveau 1 voor natrium. Het QC-materiaal wordt 30 keer herhaald en de volgende resultaten worden verkregen: 110, 110, 111, 111, 111, 111, 111, 111, 111, 111, 111, 111, 111, 112, 112, 112, 112, 112, 112, 112, 112, 112, 112, 112,112,112, 113, 113, 113 en 113.

De som van de dertig resultaten is 3346. Het gemiddelde wordt berekend door 3346 te delen door 30, wat een resultaat geeft van 111,6. SD is 0,8 en CV is 0,72%. Het 95%-betrouwbaarheidsinterval is het gemiddelde +/- 2SD of 110,0 – 113,2.

Precisie tussen runs is een betere indicator van de algehele precisie van een methode dan precisie binnen runs, omdat het de hoeveelheid willekeurige fouten meet die inherent zijn aan de methode van dag tot dag. De nauwkeurigheid tussen runs wordt beïnvloed door vele variabelen, zoals veranderingen in operators, reagentia en omgevingscondities.

Concentratie van de analyt in kwaliteitscontrolemonsters moet zo dicht mogelijk bij de bovenste en onderste medische beslissingspunten liggen (meestal de referentielimieten). De precisie tussen runs moet over een periode van ten minste 20 dagen worden geëvalueerd met behulp van ten minste 2 reagenspartijen. Het gemiddelde, de standaarddeviatie en de variatiecoëfficiënt worden voor elk niveau berekend.

De standaarddeviatie die wordt verkregen tijdens dagelijkse replicatieonderzoeken zal naar verwachting groter zijn dan de standaarddeviatie van binnen-run-onderzoeken. De maximaal toegestane standaarddeviatie tussen runs is een kwestie van oordeel. Over het algemeen moet deze kleiner zijn dan de totale toegestane fout (zie bijlage B).

Er moeten acceptabele CV's worden gedefinieerd voor elke analyt op basis van medische significantie. Over het algemeen moet de precisie gelijk zijn aan of kleiner zijn dan de helft van de biologische variatie binnen het onderwerp. Gewenste precisieniveaus voor enkele veelvoorkomende chemische analyten zijn samengevat in de volgende tabel.

analyt CV % analyt CV%
Chloride 0.6 cholesterol 3.0
osmolaliteit 0.7 Gratis T4 3.8
Calcium 1.0 Fosfaat 4.3
Albumine 1.6 AST 6.0
Magnesium 1.8 TSH 9.7
Creatinine 2.2 triglyceriden 10.5
Potassium 2.4 ALT 12.2

Precisieniveaus variëren afhankelijk van de analyt en de methode. Over het algemeen hebben elektrolyten en creatinine een zeer laag CV%, wat wijst op een zeer goede precisie. Enzymen en immunoassays hebben doorgaans een hoger CV%. Een andere vuistregel is dat de CV of SD van een methode <1/8ste van de breedte van het referentiebereik moet zijn. Dit kan gemakkelijker worden berekend met behulp van de volgende formule:

4 (CV of SD) < 1/2 van referentiebereikbreedte

Als het referentiebereik voor natrium 136-145 meq/L is en de SD 1,25 is, dan is 4x1,25 =5, wat de helft is van de referentiebereikbreedte van 10.

Precisie berekend met behulp van materiaal voor kwaliteitscontrole is beter dan voor werkelijke patiëntmonsters. Soms merken artsen een afwijking in de testwaarden op voordat het kwaliteitscontroleprogramma van een laboratorium een ​​probleem detecteert. Klinische laboratoria moeten de resultaten van de kwaliteitscontrole voortdurend beoordelen en de bereiken zo veel mogelijk aanscherpen.


Biologie GCSE & IGCSE Vragenbank

Biologie GCSE & IGCSE Vragenbank, met oefeningen en discussies

Vragen. De meeste vragen zijn bedoeld voor zelfevaluatie. De informatie is te vinden op de pagina's van GCSE Biologie en IGCSE Biologie.

Paragrafen 1-5 komen overeen met de paragrafen in GCSE Biologie en IGCSE Biologie. De secties 6 en 7 zijn ontleend aan de hoofdstukken 30-39.

Oefeningen en discussies. Deze vragen zijn veeleisender en testen Interpretatie van gegevens (I), Hypotheseformulering en ontwerp (H), Experimenteel ontwerp (E), Toepassing van biologische informatie (A), Begrip van wetenschappelijke artikelen (C) evenals eenvoudig terugroepen (R ).

De documenten worden aangeboden in Word-formaat. Als u Microsoft Word niet hebt geïnstalleerd, zie hier voor advies over hoe u ze kunt bekijken. De documenten kunnen afzonderlijk worden bekeken of gedownload, of volledige secties kunnen worden gedownload in een zip-bestand met de Allemaal gezipt koppelingen.

Interactieve vragen. De interactieve meerkeuzevragen komen overeen met de meerkeuzevragen in GCSE- en IGCSE-examenpapers. Ze zijn in PowerPoint-indeling en moeten worden uitgevoerd als een diavoorstelling. Elke set bevat ongeveer 20 vragen. De juiste antwoorden worden aangegeven, evenals een toelichting op de redenen voor het afwijzen van de alternatieven. We raden u aan de PowerPoints te downloaden en ze vanaf uw schijf uit te voeren. Als u PowerPoint niet hebt geïnstalleerd, kunt u PowerPoint Viewer gratis downloaden hier.


Als gevolg van de aanzienlijke verstoring die wordt veroorzaakt door de COVID-19-pandemie, zijn we ons er terdege van bewust dat veel onderzoekers tijdens normale tijden moeite zullen hebben om de tijdlijnen te halen die zijn gekoppeld aan ons peer review-proces. Laat het ons weten als u meer tijd nodig heeft. Onze systemen zullen u blijven herinneren aan de oorspronkelijke tijdlijnen, maar we zijn van plan om op dit moment zeer flexibel te zijn.

Professor Jean Marie Francois

Jean Marie Francois behaalde zijn doctoraat in agronomie en biologische chemie aan de Katholieke Universiteit van Louvain La Neuve in 1988. Na verschillende postdoctorale periodes in de VS (North Carolina State University), Frankrijk (Université de Bordeaux II en CNRS Gif sur Yvette), Brazilië (Universiteit Sao Paulo) en University Louvain La Neuve, werd hij in 1993 gewoon hoogleraar aan het Institute National des Sciences Appliquées, Federale Universiteit van Toulouse en bereikte de uitzonderlijke klasse in 2009. Sindsdien heeft hij twee onderzoeksgroepen opgericht en nog steeds geleid ( ongeveer 25 personen, waaronder twee universitair hoofddocenten, vier senior onderzoekers, 10 technische ingenieurs, vier promovendi en vijf postdocs) die zich bezighouden met geïntegreerde fysiologie en functionele genomica van microbiële systemen (PHYGE-team) bij het Toulouse Biotechnology Institute en het Toulouse White Biotechnology Center.

Dr. Michael Himmel

Dr. Himmel heeft 38 jaar vooruitstrevende ervaring in het uitvoeren, begeleiden en plannen van onderzoek op het gebied van eiwitbiochemie, recombinanttechnologie, enzymtechnologie, ontdekking van nieuwe micro-organismen en de fysicochemie van macromoleculen. Hij heeft ook toezicht gehouden op onderzoek dat gericht is op de toepassing van plaatsgerichte mutagenese en rationeel eiwitontwerp voor de stabilisatie en verbetering van belangrijke industriële enzymen, met name glycosylhydrolasen en metabole route-enzymen. Nieuwe interessegebieden voor zijn onderzoeksgroep zijn onder meer 'groene elektronica' en toepassingen van nanomaterialen van uit biomassa afgeleide componenten.


Bekijk de video: WAT GEBEURT ER BIJ KANKER? Vraag het dokter Elbert. NPO Zapp (December 2021).