Informatie

Huishoudgenen voor één kopie


Ik werk aan een tool voor SNP-oproepen in polyploïde planten. Om mijn methode te testen, heb ik een lijst nodig van huishoudgenen die in bijna alle planten voorkomen. Voor mijn geval moeten deze genen een enkele kopie zijn (dwz elk HK-gen mag geen paralogen hebben).

In het kort heb ik een lijst met genen nodig die zijn:

  1. Huishouden
  2. Enkele kopie
  3. Vaak in bijna alle genomen, of genomen van een taxa

Alle hulp wordt op prijs gesteld.


Gewoon uit de taille vliegen: filterbenadering: als er een gegevensbron is die de expressiegegevens heeft voor cellen in meerdere weefsels voor elk organisme, zou ik die gebruiken om de huishoudgenen te vinden door te sorteren welke genen in het grootste aantal cellen tot expressie worden gebracht ( denk aan Excel of XML). Vervolgens zou ik controleren welke van die genen ook in/vergelijkbaar zijn met het betreffende gen (homoloog ik dun het heet) in de planten (met behulp van genoombrowser, bijv. Ensembl en blast of kijk het gewoon en klik op de knop om te brengen u naar het plantengenoom). Als je modelorganisme geen genoomsequentie heeft... koop primers en kijk of je het zelf kunt sequencen om te zien of het er is. Controleer vervolgens of het een enkele kopie is. Het moeilijkste is om een ​​expressoomdatabase te vinden die meerdere weefsels in een organisme omvat om huishoudgenen te vinden - en dan te hopen dat ze voor de plant behouden blijven. Als alternatief kunt u literatuur raadplegen om huishoudgenen te vinden.

Je wilde waarschijnlijk alleen een lijst van de genen... sorry.


Het volgende is waarschijnlijk een goede set, het is voor Arabidopsis dat je moet controleren of het past bij je behoefte.

CBP20 gengen locus: At5g44200

Actine-2 gengen locus: At3g18780

UBC-gengenlocus: At5g25760

SIGMA verkoopt hier primers voor: http://www.sigmaaldrich.com/life-science/molecular-biology/plant-biotechnology/plant-molecular-biology/control-primers-for-arabidopsis.html


Er is niet één antwoord voor een gen. Het meest juiste om te doen is om een ​​set genen over veel locus te gebruiken en eerst de correlatie van het kopie-aantal over hen te meten, en alleen die genen te gebruiken die co-segregeren als een enkel kopie-nummer als de maat voor 'één kopie'.

Dit is dezelfde benadering die wordt gebruikt voor qPCR en is de basis van het veelgebruikte geNorm-algoritme (11k citaties). Terwijl in qRT-PCR de 'stabiliteit' van een genexpressie wordt vergeleken over mRNA dat een verschillende stoichiometrie heeft, beperk je in jouw geval alleen maar verder dat de genen stabiele stoichiometrie moeten hebben.

Als ik dit zou ontwerpen, zou ik dezelfde set genen gebruiken die 'huishoudsters' zijn zoals gedefinieerd in de twee bovenstaande publicaties en geslachtschromosomen vermijden.


Huishoudelijk gen

De huishoudgenen die voor MLSA-analyses zijn geselecteerd, moeten enkele exemplaren zijn, ortholoog en alomtegenwoordig onder alle bemonsterde stammen. Ze moeten ook in hoge mate geconserveerd zijn, geen koppelingsonevenwicht op het chromosoom hebben, maar voldoende variërende nucleotideposities bevatten om nauwkeurig verbanden tussen nauw verwante stammen vast te stellen. Om een ​​evenwicht te vinden tussen acceptabele identificatiekracht, tijd en kosten voor het typen van stammen, worden gewoonlijk ongeveer vijf tot zeven huishoudgenen gebruikt. De vijf huishoudgenen die we hebben gebruikt in onze Streptomyces MLSA-schema zijn atpD (ATP-synthase F1, β-subeenheid), gyrB (DNA-gyrase, B-subeenheid), recA (recombinase A), rpoB (RNA-polymerase, β-subeenheid) en trpB (tryptofaansynthase, β-subeenheid) de fysieke afstand tussen twee van deze genen is groter dan 30 kb in een enkele Streptomyces genoom, waardoor liftende effecten worden vermeden (Guo, Zheng, Rong, & Huang, 2008 Rong & Huang, 2012). Het is echter niet ongebruikelijk om tot 10 huishoudgenen te gebruiken, zoals geïllustreerd in het geval van het geslacht Nocardia waar 14 eiwitcoderende genen werden onderzocht (Tamura et al., 2012). Dus zowel het aantal als het type huishoudgenen dat door MLSA wordt ondervraagd, kan van geslacht tot geslacht verschillen.


Achtergrond

Het bepalen van de fylogenetische relaties tussen gensequenties is fundamenteel voor vergelijkend biologisch onderzoek. Het biedt het kader voor het begrijpen van de evolutie en diversiteit van het leven op aarde en maakt de extrapolatie van biologische kennis tussen organismen mogelijk. Gezien het centrale belang van dit proces voor meerdere gebieden van biologisch onderzoek, is een breed scala aan softwaretools ontwikkeld die proberen deze relaties te identificeren op basis van sets van door de gebruiker geleverde gensequenties [1,2,3]. De meeste van deze softwaretools proberen fylogenetische relaties tussen gensequenties af te leiden door middel van heuristische analyses van paarsgewijze sequentieovereenkomstscores (of verwachtingswaarden) verkregen uit een alles-tegen-alles BLAST [4]-zoekopdracht, of versnelde alternatieven voor BLAST zoals DIAMOND [ 5] of MMseqs2 [6]. Veelgebruikte methoden zijn onder meer InParanoid [7], OrthoMCL [8], OMA [9] en OrthoFinder [10] die allemaal verschillende benaderingen hanteren voor het opvragen van sequentieovereenkomstscores, en die allemaal verschillende outputs produceren - sommige identificeren orthogroepen, sommige identificeren orthologen en paralogen, en sommigen doen beide. Omdat ze elk verschillende benaderingen hanteren voor het analyseren van sequentieovereenkomstscores, vertoont elk van de methoden verschillende prestatiekenmerken op veelgebruikte benchmarkdatabases [1, 11].

Heuristische analyse van paarsgewijze sequentie-overeenkomstscores is van oudsher gebruikt om de fylogenetische relatie tussen genen te schatten, omdat deze gemakkelijk rekenkundig hanteerbaar is. Het centrale uitgangspunt dat aan hun gebruik ten grondslag ligt, is dat hoger scorende sequentieparen waarschijnlijk recenter zijn gedivergeerd dan lager scorende sequentieparen. Heuristische analyse van sets van paarsgewijze sequentie-overeenkomstscores kan dus worden gebruikt om de fylogenetische relaties tussen sets genen te schatten [7,8,9, 12, 13]. Dergelijke op scores gebaseerde schattingen van de fylogenetische relatie tussen genen worden echter verward door meerdere factoren. Variabele sequentie-evolutiesnelheden tussen genen leiden bijvoorbeeld vaak tot zowel vals-positieve als vals-negatieve fouten [14, 15] (Fig. 1). Dergelijke fouten kunnen worden verzacht door de analyse van fylogenetische bomen van genen [17], aangezien fylogenetische bomen in staat zijn om variabele sequentie-evolutiesnelheden (taklengtes) te onderscheiden van de volgorde waarin sequenties divergeerden (boomtopologie) en zo orthologie- en paralogische relaties verduidelijken (Figuur 1).

Orthologe inferentie op basis van een paarsgewijze gelijkenisscore kan worden misleid door variabele sequentie-evolutiesnelheden. een Fylogenetische boom van een typische genenfamilie. De juiste orthologen van soort A-gen 1 zijn niet geïdentificeerd. B Soort A-gen 2 is ten onrechte geïdentificeerd als de ortholoog van de genen van soort B en C. Linkerzijde: genenbomen met vertakkingen op schaal en de ware orthologische relaties, die uit de genenboom kunnen worden bepaald. Rechts: Wederzijdse beste treffers (RBH) op basis van genovereenkomstscores die monotoon zijn met vertakkingslengte en de orthologierelaties afgeleid uit deze scores met behulp van standaardheuristieken (orthologen afgeleid met behulp van RBH's en co-orthologie geïdentificeerd vanuit soort hits beter dan dichtstbijzijnde RBH [8, 16]). FP, vals positief FN, vals negatief

Er zijn een aantal boomgebaseerde online databases van orthologen ontwikkeld, waaronder PhylomeDB [18], Ensembl-Compara [19], EggNOG [20] en TreeFam [21]. Deze veelgebruikte bronnen bieden de gebruiker de mogelijkheid om de evolutionaire geschiedenis van genen te verkennen met behulp van fylogenetische bomen, waardoor een completer beeld ontstaat dan alleen paarsgewijze orthologie en paralogische relaties alleen. Vergelijkende analyses van deze methoden met behulp van standaard benchmarking-benaderingen hebben geen significant verschil gevonden in de nauwkeurigheid van orthologe detectie van deze online databases en op scores gebaseerde softwaretools [1], wat suggereert dat de voordelen van een fylogenetische benadering nog niet volledig zijn gerealiseerd. Bovendien zijn de pijplijnen en methodologieën achter deze online databases over het algemeen niet beschikbaar voor gebruikers om hun eigen analyses uit te voeren. Er is dus behoefte aan een geautomatiseerde softwaretool die effectief gebruik maakt van de fylogenetische benadering om de nauwkeurigheid te vergroten, maar met het gebruiksgemak, de snelheid en schaalbaarheid van een op scores gebaseerde heuristische methode.

Hoewel een geautomatiseerde softwaretool voor fylogenetische orthologie-inferentie uit gensequenties een belangrijk doel is, brengt de implementatie van een dergelijke methode verschillende technische uitdagingen met zich mee. Deze omvatten het volgende: (1) het afleiden van een complete set genenbomen voor alle genen van een bepaalde set soorten in een tijdschaal die concurrerend is met op scores gebaseerde heuristische methoden (2) het automatisch rooten van deze genenbomen zodat ze kunnen correct worden geïnterpreteerd [22] zonder dat de gebruiker de geroote soortenboom van tevoren moet kennen en (3) de genenbomen interpreteren om genduplicatiegebeurtenissen, orthologen en paralogen te identificeren, terwijl ze robuust zijn tegen processen zoals genduplicatie, verlies, onvolledige afstamming sortering en onnauwkeurigheden in de genenboom. Als deze uitdagingen op een hulpbronnen- en tijdbesparende manier zouden kunnen worden aangepakt, zou een dergelijke fylogenetische methode een stapsgewijze verandering bieden voor orthologische gevolgtrekking, waardoor de overgang mogelijk wordt van op gelijkenisscores gebaseerde schattingen van fylogenetische relaties naar fylogenetisch afgebakende fylogenetische relaties tussen genen.

Sommige van de hierboven genoemde uitdagingen zijn afzonderlijk aangepakt door een reeks bio-informatische methoden. Er is bijvoorbeeld een reeks methoden voor het identificeren van orthogroepen van genen uit door de gebruiker aangeleverde gensequenties [8,9,10, 12, 23] en een grote verscheidenheid aan genboominferentiemethoden die bomen uit deze orthogroepen kunnen afleiden [24, 25,26,27,28]. Evenzo is er een reeks methoden voor het afleiden van orthologen uit genenbomen die ook variëren in termen van schaalbaarheid en nauwkeurigheid [29,30,31,32]. Andere kritieke uitdagingen hadden echter geen bestaande oplossingen. De conclusie van een complete set van gewortelde genenbomen uit een set van soorten-proteomen zou bijvoorbeeld een complex proces zijn dat uit meerdere stappen bestaat en in het algemeen voorkennis van de soortboom vereisen. Evenzo bestonden er geen methoden om orthologen af ​​te leiden uit genbomen die robuust waren voor processen zoals onvolledige afstammingssortering en genboom-inferentiefout, terwijl ze ook schaalbaar waren voor de grootschalige analyse die nodig is voor orthologische inferentie van het hele genoom over honderden soorten. Er moesten dus aanzienlijke technische uitdagingen worden aangepakt om volledig geautomatiseerde, nauwkeurige en efficiënte fylogenetische afbakening van de fylogenetische relaties tussen genen mogelijk te maken.

Hier presenteren we een grote update van OrthoFinder die deze uitdagingen aanpakt en de reikwijdte van de oorspronkelijke methode aanzienlijk uitbreidt. De bijgewerkte versie van OrthoFinder identificeert orthogroepen zoals in de oorspronkelijke implementatie [10], maar gebruikt deze orthogroepen vervolgens om genenbomen voor alle orthogroepen af ​​te leiden en analyseert deze genbomen om de gewortelde soortenboom te identificeren. De methode identificeert vervolgens alle genduplicatiegebeurtenissen in de complete set genenbomen en analyseert deze informatie in de context van de soortboom om zowel genboom- als soortboomanalyse van genduplicatiegebeurtenissen te bieden. Ten slotte analyseert de methode al deze fylogenetische informatie om de complete set orthologen tussen alle soorten te identificeren en uitgebreide vergelijkende genomics-statistieken te bieden. De complete OrthoFinder fylogenetische orthologie-inferentiemethode is nauwkeurig, snel, schaalbaar en aanpasbaar en wordt uitgevoerd met een enkele opdracht waarbij alleen eiwitsequenties als invoer worden gebruikt.


Resultaten

Gedeelde enkelvoudige kopie-genen zijn talrijk in angiospermgenomen, evenals in andere plantenlijnen

We bepaalden eerst het aantal single-copy genen in elk van de vier soorten met hele genoomsequenties: Arabidopsis, Populus, Vitis en Oryza, en vond 4762 tot 7542 genen (Figuur 1 en aanvullend bestand 1). Het aantal single-copy genen dat tussen twee van de vier soorten werd gedeeld, was veel kleiner, van 1424 tot 2796, vooral wanneer Populus was inbegrepen. Enkele kopie-genen die werden gedeeld in drie soorten of alle vier de soorten namen verder af, maar slechts in geringe mate (Figuur 1). Dit suggereert dat de hele lijst met gedeelde genen voor een enkele kopie niet is samengesteld uit een willekeurige set genen, met 959 genen die worden gedeeld tussen Arabidopsis, Populus, Vitis en Oryza (APVO) zoals gedefinieerd door het aantal PlantTribes [63] bij stringentie 3.0 die een enkel lid van elk respectief genoom bevatten (Figuur 1 en aanvullend bestand 1). Onderzoek van de TIGR Plant Transcript-assemblages [73] geeft aan dat deze genen ook aanwezig zijn in angiospermen, hoewel het exacte aantal kopieën niet kan worden vastgesteld, aangezien EST-assemblages geen nauwkeurige schatting zijn van het aantal kopieën. Bijvoorbeeld het gemiddelde aantal planttranscriptassemblages per enkele kopie PlantTribe voor: Arabidopsis en Oryza zijn respectievelijk 1.22 en 1.51 (Extra bestand 2). Assemblages voor taxa met honderdduizenden EST's identificeren zeer waarschijnlijk enkele allelische en splice-site-varianten (versus echte duplicaten) als afzonderlijke transcripten.

Gedeelde enkelvoudige kopie-genen in verschillende combinaties van angiospermgenomen. Angiosperm genomen worden als volgt afgekort: Ath - Arabidopsis thaliana Ptr - Populus trichocarpa vvi - Vitis vinifera Osa- Orysa sativa. Het aantal stammen vertegenwoordigt het aantal PlantTribes dat bij gemiddelde strengheid (3,0) wordt gevonden en dat een enkel lid van elk van de bemonsterde genomen bevat.

We hebben duplicatiegebeurtenissen in genfylogenieën gekarakteriseerd voor achttien gedeelde genen met een enkele kopie die zijn geïdentificeerd in de genomen waarvan de sequentie is bepaald en met een bijzonder goede overlap in sequentiebeschikbaarheid via de belangrijkste angiosperm-groepen. We ontdekten dat dubbele kopieën (paralogen en co-orthologen) beperkt waren tot recente polyploïdie-lijnen. Lineage-specifieke paraloge en co-orthologe paren vertegenwoordigden onafhankelijke duplicaties in de Asteraceae, Solanaceae, Fabaceae en Gossypium (Extra bestand 3). Vergelijking van de set gedeelde genen voor een enkele kopie die in deze studie is geïdentificeerd met een set van nucleaire genen met een enkele kopie en een lage kopie die vaak zijn gebruikt voor fylogenetica van angiosperm [5, 37-44, 57, 58] geeft aan dat weinig eerder gebruikte fylogenetische markers (zoals LFY) zijn leden van APVO gedeelde enkele kopie PlantTribes - d.w.z. de set van eerder gebruikte fylogenetische markers behoort typisch tot PlantTribes waarin het aantal kopieën varieert tussen de vier onderzochte genomen en/of deze fylogenetische markers zijn leden van grotere genfamilies.

Wanneer we de vier angiospermgenomen beschouwen samen met die van twee extra landplanten, Selaginella (een lycophyte, of vroege divergerende vaatplant), Physcomitrella (een mos of niet-vasculaire plant), zijn er 395 PlantTribes die een enkel gen van elk van de zes genomen bevatten. Wanneer kopie nummer in Selaginella of Physcomitrella is niet beperkt tot één, er zijn 699 gedeelde single-copy APVO PlantTribes die aanwezig zijn in Selaginella en 558 gedeelde single-copy APVO PlantTribes die aanwezig zijn in Physcomitrella. Zelfs als we kijken naar de verre algensoort Chlamydomonas reinhardtii, 362 gedeelde single-copy APVO PlantTribes zijn aanwezig in Chlamydomonas met één of twee exemplaren. Wanneer de TIGR Plant Transcript Assemblies worden overwogen, die een breed scala aan groene algen en terrestrische planten omvatten, hebben 438 APVO PlantTribes ten minste één hit in een niet-zaadachtige landplantensoort en 190 APVO PlantTribes hebben ten minste één hit in een groene algen (chlorofyt of charophyte) soorten (tabel 1 en ook aanvullend bestand 4). Daarom kunnen grote subsets van de gedeelde enkelvoudige PlantTribes in verschillende fotosynthetische eukaryote organismen tot wel 1.000 miljoen jaar zijn gehandhaafd.

Gedeelde single-copy genen hebben onderscheidende kenmerken in vergelijking met de rest van het genoom

Om aanwijzingen te krijgen van mogelijke functies van de gedeelde genen voor één kopie, hebben we hun GO slim-categorieën geanalyseerd (Figuur 2). De APVO gedeelde enkelvoudige kopie-genen zijn oververtegenwoordigd in de volgende GO slim-categorieën: chloroplast, mitochondria, plastide, andere intracellulaire componenten, andere cytoplasmatische componenten, andere enzymactiviteit, DNA- of RNA-metabolisme, onbekende moleculaire functie en onbekende biologische processen. Gedeelde single-copy genen zijn significant ondervertegenwoordigd in verschillende GO-categorieën: andere membranen, onbekende cytoplasmatische componenten, kern, transporteractiviteit, nucleïnezuurbinding, andere moleculaire functies, transcriptiefactoractiviteit, kinase-activiteit, andere biologische processen, eiwitmetabolisme, transport, transcriptie, reactie op abiotische of biotische stimulus en signaaltransductie. Dit komt overeen met bevindingen dat behouden duplicaten de neiging hebben om te coderen voor eiwitten met bekende functies zoals subeenheden van macromoleculaire complexen (bijv. structurele bestanddelen van ribosomen), eiwitten met regulerende functies (bijv. transcriptiefactoren) en sterk verbonden signaalcomponenten, vooral die met tegengestelde functies in netwerken (bijv. kinase en fosfatase) [8, 74–76]. Deze resultaten weerspiegelen ook het resultaat verkregen door analyse van geconserveerde orthologe sets (COSII) geïdentificeerd in de euasterid-clade die wijzen op een associatie van genen met een enkele kopie met genen die zijn gericht op de chloroplast en mitochondriën, evenals genen die zijn geassocieerd met DNA- en/of RNA-metabolisme [6].

Oververtegenwoordiging en ondervertegenwoordiging van gedeelde genen voor één kopie in geselecteerde GO-categorieën. Staafdiagram met GO slim-categorieën die oververtegenwoordigd zijn in de APVO PlantTribes met behulp van de TAIR8-annotatie van de Arabidopsis thaliana genoom met een initiële alfa-waarde van 0,05 met een daaropvolgende Bonferroni-correctie voor meerdere tests. De onderste groene balk geeft het percentage van APVO gedeelde genen voor een enkele kopie weer met de gegeven annotatie. De bovenste blauwe balk is het percentage genen met de gegeven annotatie voor de rest van het genoom. Oververtegenwoordiging en ondervertegenwoordiging werden gedetecteerd met behulp van een chi-kwadraattest die de slanke GO-annotatie van de stammen met één kopie vergeleek met al het andere in de Arabidopsis genoom.

Gedeelde single-copy genen van APVO PlantTribes hebben meer exons dan andere genen (p < 0,00001, 2-tailed Student's t-test met ongelijke varianties). Dit resultaat geldt wanneer intronloze, mogelijk retro-getransponeerde genen van de analyse worden uitgesloten. Een ander opmerkelijk onderscheid van de APVO PlantTribes is het kleinere aantal PFAM-domeinen dat aanwezig is in de gedeelde enkelvoudige kopie-genen ten opzichte van de andere genen in de genomen waarvan de sequentie is bepaald (p < 0,00001, 2-tailed Student's t-test met ongelijke varianties). Er is echter geen significant verschil in cDNA-lengte (p = 0,998, 2-zijdige Student's t-test met ongelijke varianties). Samengevat zijn de gedeelde genen voor een enkele kopie structureel complexe genen, met een groter aantal exons in de coderende sequentie. Ze lijken echter niet functioneel complex te zijn, omdat ze minder herkende domeinen per gen hebben dan de rest van het genoom.

Gedeelde enkelvoudige kopie-genen kunnen waardevolle fylogenetische markers zijn voor plantenfamilies

Voor succesvol gebruik van deze gedeelde enkelvoudige kopie-genen in moleculaire systematiek, moet worden aangetoond dat ze gemakkelijk kunnen worden geamplificeerd en gesequenced in een reeks taxa. Om dit te testen, hebben we primers ontworpen om 12 genen in de Brassicaceae te amplificeren. Wanneer cDNA-templates werden gebruikt met gedegenereerde primers, werden enkele banden van identieke grootte teruggewonnen over alle taxa die amplicons opleverden (Tabel 2). Directe sequentiebepaling van deze loci leverde sequenties op met kleine polymorfismen. Deze polymorfismen kunnen allelisch zijn of van meerdere loci afkomstig zijn. Wanneer daarentegen genomisch DNA als matrijzen werd gebruikt, werden 1 tot 3 banden teruggewonnen (Tabel 2). Deze genomische banden varieerden in grootte zowel over als, wanneer er meer dan één werd gedetecteerd, binnen de taxa. We hebben deze 12 genen alleen geamplificeerd voor een subset van taxa om de variatie in het aantal exemplaren in de familie te onderzoeken. De sequenties van de RT-PCR-amplificatieproducten werden gebruikt voor fylogenetische analyse. Sequentie van een aantal van de genomische banden onthulde ofwel extra genomische kopieën die gepseudogeniseerd zijn, of volledig niet-verwante sequentie, maar slechts één tot expressie gebrachte kopie die overeenkwam met de sequentie van de van RT-PCR afgeleide sequentie (resultaten niet getoond).

Een gecombineerde en complete datamatrix met de genen At2 g32520, At2 g13360 en At5 g23290 homologen voor elk van de twaalf taxa leverde een enkele meest spaarzame boom op met de exact voorspelde en eerder ondersteunde topologie (Figuur 3) [77-79] maar met verhoogde bootstrap-ondersteuning op diepere knooppunten dan eerder gepubliceerde fylogenieën. De stam Brassiceae had een 100% bootstrap statistische ondersteuning en een 100% bootstrap ondersteuning dat de stam een ​​zuster is van de stam Sisymbrieae. De Brassiceae + Sisymbrieae-clade binnen lijn II, had een 99% bootstrap-ondersteuning ten opzichte van de relatieve positie ten opzichte van de Camelinae-stam binnen lijn I, en de lijn I en lijn II-clade had een 100% bootstrap-ondersteuning voor een zusterrelatie met Chorisporae ( stam III).

Enkele kopie nucleaire genen verbeteren de fylogenetische resolutie in de Brassicaceae. Een enkele meest spaarzame boom werd gevonden uit gecombineerde analyse van volledige data-matrix met genen At2 g32520, At2 g13360 en At5 g23290 (L = 961, consistentie-index = 0,774, retentie-index = 0,529). Bootstrap-waarden worden boven takken weergegeven. Merk op dat individuele genenbomen vergelijkbare topologieën gaven. De fylogenie is consistent met gepubliceerde fylogenieën met meer taxa en andere moleculaire markers. Bootstrap-waarden van Beilstein et al., 2006 worden hieronder weergegeven.

Gedeelde enkelvoudige kopie-genen zijn waardevolle fylogenetische markers over angiospermen

Zoals hierboven kort vermeld, zijn homologen van de gedeelde genen voor een enkele kopie goed vertegenwoordigd in de Plant Transcript Assemblies [73], die op het moment van deze analyse meer dan 13 miljoen planten-EST's van 233 soorten bevatten. Gezien deze rijke bron van sequentie-informatie, hebben we de aanwezigheid en distributie van homologen van gedeelde enkelvoudige kopie-genen in deze dataset in meer detail onderzocht. We vergelijken de EST-gegevens en Unigene-nummers met het bekende genkopienummer van de Arabidopsis, Populus, Vitis en Oryza genomische sequenties, en ontdekte dat het aantal Unigenes aanzienlijk verschilt van het aantal genkopieën van de genoomsequenties - hoogstwaarschijnlijk als gevolg van sequentiefouten, assemblagefouten, aantal EST's, alternatieve splicing, allelisme en andere dergelijke factoren. Met behulp van een reeks criteria (zie Methoden) die zijn ontworpen om de sequentiedekking en kwaliteit voor elke dataset te maximaliseren, hebben we fylogenetica gebruikt om onderscheid te maken tussen soortspecifieke duplicaten (die het gevolg kunnen zijn van een technische fout, allelen of een daadwerkelijke recente duplicatiegebeurtenis) en gedeelde duplicatiegebeurtenissen die zouden kunnen onthullen of er patronen zijn van onderhoud van dubbele kopieën in bepaalde geslachten. Omdat dit proces een uitgebreide handmatige inspectie van de uitlijningen vereist, werd een beperkt aantal (achttien) genen geselecteerd voor de fylogenetische analyse. Deze achttien genen werden geselecteerd omdat er EST-sequenties van volledige lengte beschikbaar waren over de belangrijkste lijnen van angiospermen.

We ontdekten dat fylogenieën met één gen een goed ondersteunde resolutie bieden op het niveau van plantenfamilies (Tabel 3). Met name de grote plantenfamilies Fabaceae, Poaceae, Asteraceae en Solanaceae, die allemaal goed vertegenwoordigd zijn in de Plant Transcript Assemblies, worden sterk ondersteund in de fylogenieën met één gen (aanvullend bestand 3). Gedeelde duplicaties in een bepaalde afstamming zijn ook aanwezig in vijf van de individuele genfylogenieën. Deze genen werden uitgesloten van de daaropvolgende aaneengeschakelde uitlijning. Dergelijke gedeelde duplicaties binnen een afstamming worden geassocieerd met paleopolyploïdiegebeurtenissen die plaatsvonden binnen bepaalde afstammingen [1, 3]. Opgemerkt moet worden dat hoewel veel leden van Poaceae goed vertegenwoordigd zijn in de Plant Transcript Assemblies en meerdere sequenties van een enkele soort typisch werden opgenomen in de enkele genuitlijning, er geen gevallen waren van gedeelde duplicaties binnen deze plantenfamilie - meerdere sequenties van dezelfde soorten waren nauwer verwant aan elkaar dan aan sequenties van andere soorten (aanvullend bestand 3). Bovendien zijn er geen duplicaties waarbij meer dan een enkele plantenfamilie betrokken is - bewijs voor duplicaties die plaatsvonden vóór diversificatie van de bestaande plantenfamilies is niet aanwezig in deze datasets. Dit ondersteunt het idee dat duplicaten van deze genen niet blijven bestaan ​​gedurende de evolutionaire tijd en dat de aanwezigheid van meer dan één genkopie binnen een taxon hoogstwaarschijnlijk het resultaat is van relatief recente duplicatiegebeurtenissen. Als genverlies echter niet snel na duplicatie plaatsvond, is het mogelijk dat de genen die in verschillende lijnen worden behouden, paraloog zijn. Dit kan leiden tot goed onderbouwde conflicten tussen genenbomen. In onze analyses, tegenstrijdigheden met de algemene consensus over angiosperm-fylogenie, zoals: Acorus vallen binnen magnoliiden in plaats van een basale positie binnen eenzaadlobbigen, hebben slechte bootstrap-ondersteuning (<70%).

In tegenstelling tot de individuele genfylogenieën, vertonen fylogenetische bomen op basis van een aaneengeschakelde uitlijning van 13 van de gedeelde enkelvoudige kopie-genen (Figuur 4) een verbeterde resolutie en zijn vergelijkbaar met recent gerapporteerde fylogenieën [61, 62, 80, 81], hoewel er significante verschillen met de plaatsing van individuele soorten tussen de MP- en ML-bomen. Over het algemeen vertoont de ML-structuur een verbeterde resolutie en verhoogde bootstrap-ondersteuning in vergelijking met de MP-structuur (tabel 3). De eurosiden, asteriden en eenzaadlobbigen worden allemaal opgelost als monofyletisch (Figuur 4). Alle plantenfamilies met meerdere soorten in de datasets worden opgelost als monofyletisch met sterke bootstrap-ondersteuning. In alle gevallen waarin meerdere leden van een geslacht in de analyse worden opgenomen, worden geslachten opgelost als monofyletisch met sterke bootstrap-ondersteuning. Eurosids I en II zijn parafyletisch met de Sapindales (Eurosid II) zus van een clade die de Malpighiales (Eurosid I) bevat met een slechte bootstrap-ondersteuning (minder dan 50% in MP en 53% in ML). Afgezien van de plaatsing van de Malpighiales, is de rest van de Eurosid II-lijn monofyletisch. Vitales zijn basaal voor de eurosiden met slechte bootstrap-ondersteuning (<50%). Euasterids I en II zijn beide monofyletisch met sterke bootstrap-ondersteuning. De positie van het caryophillid bèta is niet stabiel, nestelt in de eurosid II-clade in de MP-fylogenie en zus van de Asterids in de ML-fylogenie, met minder dan 50% bootstrap-ondersteuning voor beide plaatsingen. Ranunculales zijn zuster van alle kerneudicots met sterke ondersteuning in de ML-analyse en matige ondersteuning in de MP-analyse. Binnen de eenzaadlobbigen, Acorus is basaal, met Zingiber zus van de Poaceae. Beperkte resolutie bij basale knooppunten, zoals de affiliatie van de kerneudicots, magnoliiden en basale angiospermen, zal naar verwachting het resultaat zijn van de beperkte hoeveelheid sequentie-informatie die beschikbaar is voor deze lijnen. Magnoliiden zijn de zus van de eudicots, met slechte bootstrap-ondersteuning, in tegenstelling tot hun plaatsingszuster van de monocots + eudicots in volledige plastidegenoomdatasets [61, 62]. De bestelling van Amborella en Nufar schakelt tussen de MP- en ML-structuur, met minder dan 50% ondersteuning voor Amborella als het meest basale angiosperm in de MP-fylogenie en met 52% bootstrap-ondersteuning voor Nufar als het meest basale angiosperm in de ML-fylogenie. Gymnosperm-relaties zijn niet informatief gezien de beworteling van de boom met Picea sitchensis en de beperkte taxonbemonstering omdat er onvoldoende dekking was van de doelgenen voor leden van de Zamiales, Ginkgoales en Gnetales.

Angiosperm-fylogenie met behulp van EST's voor 13 gedeelde genen voor één kopie. De boom die links wordt weergegeven, is de MP-boom die is bepaald uit de aaneengeschakelde datamatrix voor 13 genen met een enkele kopie met behulp van 69 zaadplantentaxa. De boom die rechts is afgebeeld, is de ML-boom die is bepaald uit de aaneengeschakelde datamatrix voor 13 enkele kopie-genen met behulp van 69 zaadplantentaxa. Bootstrap-waarden worden aangegeven door de gekleurde balken op takken met meer dan 50% bootstrap-ondersteuning. Picea sitchensis werd gebruikt als de outgroup-taxa voor alle analyses. Taxa hebben de volgende kleurcodering: eenzaadlobbigen (groen) euasterid I (lichtblauw) euasterid II (donkerblauw) eurosid I (roze) eurosid II (rood) kern eudicot (paars) basaal eudicot (bruin) magnoliid (oranje) basaal angiosperm (donkergrijs) gymnospermen (zwart).


Materialen en methodes

Celcultuur en RNA-isolatie

De celkweekexperimenten die in de huidige studie werden gebruikt, omvatten 25 verschillende experimentele groeiomstandigheden, waaronder twee ouderlijke en vier IgG-producerende CHO-cellijnen (CHO K1-afstamming). Alle gebruikte cellijnen werden gekweekt in serumvrije, dierlijke componentvrije suspensiemedia. Onze dataset vertegenwoordigde batch- en fed-batchculturen in schudkolven van 125 ml, TPP-bioreactorbuizen en statische culturen met 6 putjes, met tal van chemisch gedefinieerde of plantenhydrolysaatbevattende media en behandelingen zoals natriumbutyraat. Alle experimenten werden uitgevoerd in biologische duplicaten. Ouderlijke en recombinante cellijnen werden allemaal in de analyses opgenomen. Cellen werden verzameld tijdens de vroege en middenlogaritmische evenals stationaire fasen voor RNA-isolatie. Totale RNA-isolatie werd uitgevoerd met RNeasy Mini Kit (Qiagen, Valencia, CA). RNA-concentraties werden gemeten met behulp van Nanodrop 1100 (Nanodrop Technologies, Wilmington, DE). RNA-integriteit werd geanalyseerd met Agilent 2100 Bioanalyzer (Agilent Technologies, Santa Clara, CA).

Microarray-ontwerp, hybridisatie en expressiegegevensanalyse

Een intern ontwikkelde CHO DNA-sequentiedatabase met meer dan 60.000 totale sequenties en 9.000 geannoteerde contigs werd gebruikt om het 4x 44K aangepaste microarray-platform te ontwerpen (Agilent Technologies, SantaClara, CA). De gemiddelde sondelengte is 60 bp, met een smelttemperatuur (Tm) van 70 °C en een GC-gehalte van 45%. Elke sequentie heeft twee probes die zijn ontworpen om te hybridiseren met verschillende regio's. In het geval dat bekende genen niet vertegenwoordigd waren in onze sequentiedatabase, werden muis orthologe gensequenties gebruikt voor het ontwerp van de sonde. Dit array-platform werd gebruikt in alle 124 microarray-onderzoeken.

Er is een gemeenschappelijke RNA-referentiepool gemaakt op basis van een assortiment van CHO-lijnen en -omstandigheden om de experimenten direct te kunnen vergelijken. Technische replica's van kleurstofwisseling werden als volgt uitgevoerd: RNA-monsters werden gelabeld met Cy5 of Cy3 en gehybridiseerd tegen de gemeenschappelijke referentiepool gelabeld met respectievelijk Cy3 of Cy5.

Monsterlabeling, amplificatie en hybridisatie werden uitgevoerd met de 2-Color Low RNA Input LinearAmplification Kit (Agilent Technologies). Dia's werden gewassen in acetonitril (Sigma-Aldrich, St. Louis, MO) en behandeld met stabilisatie- en droogoplossing (Agilent Technologies) volgens het protocol van de fabrikant. Agilent Feature Extraction-software 9.5 (FE 9.5) werd gebruikt om kleurstofnormalisatie en QC-statistieken uit te voeren op basis van de protocollen van de fabrikant.

De relatieve expressieniveaus van elke probe werden genormaliseerd met behulp van de mediane fluorescentie-intensiteit van de referentiepool in elke kleurstofwisselset. CHO-specifieke HKG-kandidaten werden geselecteerd met behulp van de volgende criteria. De variatiecoëfficiënt (% CV) werd berekend met behulp van de expressiewaarde van elke probe genormaliseerd met de mediane intensiteit van de referentiepool. Elk gen moet ten minste één microarray-probe hebben met een % CV van minder dan 29,21% (25% percentiel van alle geanalyseerde probes, (Figuur 1).

Figuur 1. Geeft de verdeling weer van de % CV-waarden van de 31509-sondes op 124 microarrays die voor de huidige analyse zijn gebruikt. Quality control and background estimation probes on the microarray were excluded. The 25%percentile value is 29.21%, which was used for the primary cutoff for CHO HKG selection. The data points (n =232) with % CV greater than 300% were not shown on this histogram.

Quantitative RT-PCR Validation

Primers were designed against sequences from the internal CHO DNA sequence database using Primer3 software (http://fokker.wi.mit.edu/primer3/input.htm). The primers were 18–25 base pairs (bp) with Tm of64–65 °C. The amplicons were between 156–249 bp (tafel 2). All amplification efficiencies were calculated based on at least 4 dilution points and within a range of 90%–112%.A minimum of ten experimental conditions were randomly selected for qRT-PCR validation, with biological duplicates from the microarray experiments pooled for RT reactions. qRT-PCR was performed on a MX3000 Pthermocycler (Stratagene, La Jolla, CA) in triplicate for each experimental condition, with threshold cyclevalues (Ct) averaged from the triplicates. Reactions were run with SYBR Green Jumpstart™ Taq ReadyMix™ (Sigma-Aldrich, S4438) mixed with 1 mL of cDNA prepared from 25 ng/mL RNA and primers at 500 nM in areaction volume of 20 mL.

Figuur 2. Left panel: % CV distribution of 31 probes of the 12 CHO HKG candidates and three traditional HKGs(Gapdh, Actb and B2m). Right panel: Relative expression level distribution of the 12 CHO HKG candidates and three traditional HKGs.Each dot in the scatter dot plots represents one microarray probe. Horizontal line represents the median. Averageof all the probes of each gene is depicted for the traditional HKGs.


Scientists discover why X chromosome lacks 'housekeeping genes'

Men have one copy, women have two, but scientists have long puzzled over why the human X chromosome mostly contains genes that are active in a small number of tissues. Now, a team of researchers led by the University of Bath studying the evolution of this X chromosome has discovered why it contains such an unusual mixture of genes.

In humans, males have XY chromosomes, females have XX but only one of these is active, meaning that both sexes only have one active copy of the X chromosome.

Scientists discovered in 2002 that the X chromosome is unusual because it contains very few of the most important genes needed for basic cell function -- dubbed "housekeeping" genes.

Now the team, a collaboration between researchers at the University of Bath and Uppsala University, along with members of the FANTOM consortium, have found out why.

They analysed the world's largest compendium of data on gene activity (expression) and looked at how activity on the X chromosome compares with that on other chromosomes.

In a paper published in the journal PLoS Biologie, they found that the peak level of gene expression on the X chromosome was under half that of other chromosomes where we have two functioning copies.

The study was led by Professor Laurence Hurst, Director of the Milner Centre for Evolution based in the Department of Biology & Biochemistry at the University of Bath.

He explained: "Since we showed that X-linked genes tend to be relatively tissue specific over a decade ago, the reason as to why the X chromosome is so odd has bugged me.

"In the end, we have found the answer to be quite simple. Whereas most chromosomes operate in pairs, meaning there are two copies of each gene in every cell, in contrast, we only have one active copy of the X chromosome.

"This means it is not sustainable for highly active genes to be on the X chromosome. Housekeeping genes tend also to be highly active -- they just couldn't survive on the X."

The team also identified which genes have moved from the X to the other chromosomes over evolutionary time and those that have gone the other way.

They found that those genes that have migrated onto the X chromosome have much lower peak rates of expression that those making the reverse trip.

Hurst explained: "It's a bit like traffic on a busy road -- a highway with two lanes can have a lot more and faster traffic on it than a single lane highway.

"A consequence of having a single chromosome is that, like a one lane road, there will be gene expression traffic tailbacks on the X chromosome especially at peak periods. Hence our X chromosome will not be a tolerable home for the most highly expressed genes."

The study also found that, unlike those found on other chromosomes, the more highly expressed genes on the X chromosome were less prone to increasing their expression level over evolutionary time.

Senior author Lukasz Huminiecki of Uppsala University commented: "This fits with our traffic analogy as, if there is a tailback, it is hard to increase the speed of the cars on the road."

The team also found that there has been an evolutionary exodus of genes that are highly expressed at peak times from the X chromosome, suggesting these genes cannot function on this chromosome due to the fact there is only one active copy. For example, genes that are active in tissues such as the pancreas which secretes a large number of protein hormones, are noticeably rare on the X chromosome compared to the non-sex chromosomes.

Huminiecki added: "With the remarkable resolution of the FANTOM gene expression data, we have shown that none of the prior explanations resolves fully the mysteries of the X. For example, if you exclude genes expressed in tissues that are found in only one sex or are involved in making sperm, the remainder still have relatively tissue-specific activity."

The work has implications for new medical treatments such as gene therapy as it suggests that replacement genes should not be inserted into the X chromosome because traffic tailbacks may limit the extent to which the gene can be expressed.


Referenties

Goldblatt P: Polyploidy in angiosperms: monocotyledons. Polyploidy: biological relevance. Edited by: Lewis WH. 1980, Plenum Press, New York, 219-239.

Lewis WH: Polyploidy in angiosperms: dicotyledons. Polyploidy: biological relevance. Edited by: Lewis WH. 1980, Plenum Press, New York, 241-268.

Wendel JF: Genome evolution in polyploids. Plant Mol Biol. 2000, 42: 225-249. 10.1023/A:1006392424384.

Soltis DE, Albert VA, Leebens-Mack J, Bell CD, Patterson AH, Zheng C, Sankoff D, DePamphilis CW, Wall PK, Soltis PS: Polyploidy and angiosperm diversification. Amer J Bot. 2009, 96: 336-348. 10.3732/ajb.0800079.

Soltis PS, Soltis DE: The role of genetic and genomic attributes in the success of polyploids. Proc Nat Acad Sci USA. 2000, 97: 7051-7057. 10.1073/pnas.97.13.7051.

Wolfe KH: Yesterday’s polyploidization and mystery of diploidization. Nat Rev Genet. 2001, 2: 333-341.

Adams KL, Cronn R, Percifield R, Wendel JF: Genes duplicated by polyploidy show unequal contributions to the transcriptome and organ-specific reciprocal silencing. Proc Nat Acad Sci USA. 2003, 100: 4649-4654. 10.1073/pnas.0630618100.

Comai L: The advantages and disadvantages of being polyploid. Nature Rev Genet. 2005, 6: 836-846.

Otto SP: The evolutionary consequences of polyploidy. Cel. 2007, 131: 452-462. 10.1016/j.cell.2007.10.022.

Sémon M, Wolfe KH: Consequences of genome duplication. Curr Opin Genetics Dev. 2007, 17: 505-512. 10.1016/j.gde.2007.09.007.

Tate JA, Joshi P, Soltis KA, Soltis PS, Soltis DE: On the road to diploidization? Homoeolog loss in independently formed populations of the allopolyploid Tragopogon miscellus (Asteraceae). BMC Plant Biol. 2009, 9: 80-10.1186/1471-2229-9-80.

Doyle JJ, Egan AN: Dating the origins of polyploidy events. New Phytol. 2010, 186: 73-85. 10.1111/j.1469-8137.2009.03118.x.

Chen ZJ: Molecular mechanisms of polyploidy and hybrid vigor. Trends Plant Sci. 2010, 15: 57-71. 10.1016/j.tplants.2009.12.003.

Carputo D, Camadro EL, Peloquin SJ: Terminology for polyploids based on their cytogenetic behavior: consequences in genetics and breeding. Plant Breed Rev. 2006, 26: 105-124.

Soltis DE, Soltis PS: Molecular data and the dynamic nature of polyploidy. Crit Rev Plant Sci. 1993, 12: 243-273.

Soltis DE, Soltis PS: Polyploidy: recurrent formation and genome evolution. Trends Ecol Evol. 1999, 14: 348-352. 10.1016/S0169-5347(99)01638-9.

Segraves KA, Thompson JN, Soltis DE, Soltis PS: Multiple origins of polyploidy and the geographic structure of Heuchera grossulariifolia. Mol Ecol. 1999, 8: 253-262. 10.1046/j.1365-294X.1999.00562.x.

Vanichanon A, Blake NK, Sherman JD, Talbert LE: Multiple origins of allopolyploid Aegilops triuncialis. Theor Appl Genet. 2003, 106: 804-810.

Albach DC: Amplified fragment length polymorphisms and sequence data in the phylogenetic analysis of polyploids: multiple origins of Veronica cymbalaria (Plantaginaceae). New Phytol. 2007, 176: 481-498. 10.1111/j.1469-8137.2007.02172.x.

Grubbs KC, Small RL, Schilling EE: Evidence for multiple, autoploid origins of agamospermous populations in Eupatorium sessilifolium (Asteraceae). Plant Syst Evol. 2009, 279: 151-161. 10.1007/s00606-009-0155-y.

Meimberg H, Njoku CC, McKay JK, Rice KJ, Milan NF: Multiple origins promote the ecological amplitude of allopolyploid Aegilops (Poaceae). Amer J Bot. 2009, 96: 1262-1273. 10.3732/ajb.0800345.

Werth CR, Guttman SI, Eshbaugh WH: Recurring origins of allopolyploid species in Asplenium. Wetenschap. 1985, 228: 731-733. 10.1126/science.228.4700.731.

Soltis PS, Plunkett GM, Novak SJ, Soltis DE: Genetic variation in Tragopogon species: additional origins of the allotetraploids T. mirus and T. miscellus (Compositae). Amer J Bot. 1995, 82: 1329-1341. 10.2307/2446255.

Soltis DE, Soltis PS, Pires JC, Kovarik A, Tate J, Mavrodiev E: Recent and recurrent polyploidy in Tragopogon (Asteraceae): genetics, genomic, and cytogenetic comparisons. Biol J Linn Soc. 2004, 82: 485-501. 10.1111/j.1095-8312.2004.00335.x.

Spooner DM, Núñez J, Trujillo G, del Rosario Herrera M, Guzmán F, Ghislain M: Extensive simple sequence repeat genotyping of potato landraces supports a major reevaluation of their gene pool structure and classification. Proc Natl Acad Sci USA. 2007, 104: 19398-19403. 10.1073/pnas.0709796104.

Ovchinnikova A, Krylova E, Gavrilenko T, Smekalova T, Zhuk M, Knapp S, Spooner DM: Taxonomy of cultivated potatoes (Solanum section Petota: Solanaceae). Bot J Linn Soc. 2011, 165: 107-155. 10.1111/j.1095-8339.2010.01107.x.

Spooner DM: DNA barcoding will frequently fail in complicated groups: an example in wild potatoes. Amer J Bot. 2009, 96: 1177-1189. 10.3732/ajb.0800246.

Hijmans R, Gavrilenko T, Stephenson S, Bamberg J, Salas A, Spooner DM: Geographic and environmental range expansion through polyploidy in wild potatoes (Solanum section Petota). Global Ecol Biogeogr. 2007, 16: 485-495. 10.1111/j.1466-8238.2007.00308.x.

Hawkes JG: The potato: evolution, biodiversity, and genetic resources. 1990, Belhaven Press, Washington, DC

Hanneman RE: Assignment of endosperm balance numbers to the tuberbearing Solanums and their close non-tuber bearing relatives. Euphytica. 1994, 74: 19-25. 10.1007/BF00033762.

Spooner DM, Castillo R: Reexamination of series relationships of South American wild potatoes (Solanaceae: Solanum sect. Petota): evidence from chloroplast DNA restriction site variation. Amer J Bot. 1997, 84: 671-685. 10.2307/2445904.

Spooner DM, Rodríguez F, Polgár Z, Ballard HE, Jansky SH: Genomic origins of potato polyploids: GBSSI gene sequencing data. The Plant Genome, a Suppl to Crop Sci. 2008, 48 (Suppl 1): S27-S36.

Rodríguez F, Spooner DM: Nitrate reductase phylogeny of potato (Solanum sect. Petota) genomes with emphasis on the origins of the polyploid species. Syst Bot. 2009, 34: 207-219. 10.1600/036364409787602195.

Rodríguez F, Wu F, Ané C, Tanksley S, Spooner DM: Do potatoes and tomatoes have a single evolutionary history, and what proportion of the genome supports this history?. BMC Evol Biol. 2009, 9: 191-10.1186/1471-2148-9-191.

Ames M, Spooner DM: Phylogeny of Solanum series Piurana and related species in Solanum section Petota based on five conserved ortholog sequences. taxon. 2010, 59: 1091-1104 + 4pg. foldout.

Fajardo D, Spooner DM: Phylogenetic relationships of Solanum series Conicibaccata and related species in Solanum section Petota inferred from five conserved ortholog sequences. Syst Bot. 2011, 36: 163-170. 10.1600/036364411X553252.

Rodríguez F, Ghislain M, Clausen AM, Jansky SH, Spooner DM: Hybrid origins of cultivated potatoes. Theor Appl Genet. 2010, 121: 1187-1198. 10.1007/s00122-010-1422-6.

Peralta IE, Spooner DM, Knapp S: The taxonomy of tomatoes: a revision of wild tomatoes (Solanum section Lycopersicon) and their outgroup relatives in sections Juglandifolium and Lycopersicoides. Syst Bot Monogr. 2008, 84: 1-186 + 3 plates.

Spooner DM, Van den Berg RG, Bamberg JB: Examination of species boundaries of Solanum series Demissa and potentially related species in series Acaulia and series Tuberosa (sect. Petota). Syst Bot. 1995, 20: 295-314. 10.2307/2419497.

Kardolus JP: Morphological variation within series Acaulia Juz. (Solanum sect. Petota). Solanaceae IV: advances in biology and utilization. Edited by: Nee M, Symon DE, Lester RN, Jessop JP. 1999, Royal Botanic Gardens, Kew, 257-274.

Nakagawa K, Hosaka K: Species relationships between a wild tetraploid potato species, Solanum acaule Bitter, and its related species as revealed by RFLPs of chloroplast and nuclear DNA. Amer J Potato Res. 2002, 79: 85-98. 10.1007/BF02881517.

Spooner DM, Van den Berg RG, Rodríguez A, Bamberg J, Hijmans RJ, Lara-Cabrera SI: Wild potatoes (Solanum section Petota) of North and Central America. Syst Bot Monogr. 2004, 68: 1-209.

Matsubayashi M: Phylogenetic relationships in the potato and its related species. Chromosome engineering in plants: genetics, breeding, evolution, part B. Edited by: Tsuchiya T, Gupta PK. 1991, Elsevier Science BV, Amsterdam, 93-118.

Pendinen G, Gavrilenko T, Jiang J, Spooner DM: Allopolyploid speciation of the tetraploid Mexican potato species Solanum stoloniferum and S. hjertingii revealed by genomic in situ hybridization. Genome. 2008, 51: 714-720. 10.1139/G08-052.

Wu FN, Mueller LA, Crouzillat D, Petiard V, Tanksley SD: Combining bioinformatics and phylogenetics to identify large sets of single-copy orthologous genes (COSII) for comparative, evolutionary and systematic studies: a test case in the euasterid plant clade. Genetics. 2006, 174: 1407-1420. 10.1534/genetics.106.062455.

Levin RA, Whelan A, Miller JS: The utility of nuclear conserved ortholog set II (COSII) genomic regions for species-level phylogenetic inference in Lycium (Solanaceae). Mol Phylogenet Evol. 2009, 53: 881-890. 10.1016/j.ympev.2009.08.016.

Zhou L, Yang CF, Xiao LH: PCR-mediated recombination between Cryptosporidium spp. of lizards and snakes. J Eukaryoten Microbiol. 2003, 50: 563-565. 10.1111/j.1550-7408.2003.tb00630.x.

Ortí G, Hare MP, Avise JC: Detection and isolation of nuclear haplotypes by SSCP. Mol Ecol. 1997, 6: 575-580. 10.1046/j.1365-294X.1997.00212.x.

Rodríguez F, Cai D, Teng Y, Spooner DM: Asymmetric single-strand conformation polymorphism: an accurate and cost-effective method to amplify and sequence allelic variants. Amer J Bot. 2011, 98: 1061-1067. 10.3732/ajb.1000251.

Hosaka K, Spooner DM: RFLP analysis of the wild potato species, Solanum acaule Bitter (Solanum sect. Petota). Theor Appl Genet. 1992, 84: 851-858.

Kardolus JP: A biosystematic analysis of Solanum acaule. Ph.D. Thesis. 1998, Wageningen Agricultural University, Wageningen, The Netherlands

Valcárcel V, Fiz O, Vargas P: Chloroplast and nuclear evidence for multiple origins of polyploids and diploids of Hedera (Araliaceae) in the Mediterranean basin. Molec Phylo Evol. 2003, 27: 1-20. 10.1016/S1055-7903(02)00364-0.

Ashton PA, Abbott RJ: Multiple origins and genetic diversity in the newly arisen allopolyploid species, Senecio cambrensis Rosser (Compositae). Heredity. 1992, 68: 25-32. 10.1038/hdy.1992.3.

Brochmann C, Soltis PS, Soltis DE: Multiple origins of the octoploid Scandinavian endemic Draba cacuminum: electrophoretic and morphological evidence. Nordic J Bot. 1992, 12: 257-272. 10.1111/j.1756-1051.1992.tb01303.x.

Doyle JJ, Doyle JL, Brown AHD, Palmer RG: Genomes, multiple origins, and lineage recombination in the Glycine tomentella (Leguminosae) polyploid complex: histone H3-D gene sequences. Evolution. 2002, 56: 1388-1402.

Rauscher JT, Doyle JJ, Brown AHD: Multiple origins and nrDNA internal transcribed spacer homeologue evolution in the Glycine tomentella (Leguminosae) allopolyploid complex. Genetics. 2004, 166: 987-998. 10.1534/genetics.166.2.987.

Wyatt R, Odrzykoski IJ, Stoneburner A, Bass HW, Galau GA: Allopolyploidy in bryophytes: multiple origins of Plagiomnium medium. Proc Natl Acad Sci USA. 1988, 85: 5601-5604. 10.1073/pnas.85.15.5601.

Gaeta RT, Pires JC, Iniguez-Luy F, Leon E, Osborn TC: Genomic changes in resynthesized Brassica napus and their effects on gene expression and pheontype. Plant Cell. 2007, 19: 3403-3417. 10.1105/tpc.107.054346.

Stupar RM, Bhaskar PB, Yandell BS, Rensink WA, Hart AL, Ouyang S, Veilleux RE, Busse JS, Erhardt RJ, Buell CR, Jiang J: Phenotypic and transcriptional changes associated with potato autopolyploidization. Genetics. 2007, 176: 2055-2067. 10.1534/genetics.107.074286.

Doyle JJ, Flagel LE, Patterson AH, Rapp RA, Soltis DE, Soltis PS, Wendel JF: Evolutionary genetics of genome merger in plants. Ann Rev Genet. 2008, 42: 443-461. 10.1146/annurev.genet.42.110807.091524.

Rieseberg L, Willis JH: Plant speciation. Wetenschap. 2007, 317: 910-914. 10.1126/science.1137729.

Soltis DE, Soltis PS, Schemske DW, Hancock JF, Thompson JN, Husband BC, Judd WS: Have we grossly underestimated the number of species?. taxon. 2007, 56: 13-30.

Estimating species trees: practical and theoretical aspects. Edited by: Knowles LL, Kubatko LS S. 2010, Wiley-Blackwell, Hoboken, New Jersey

Buggs RJA, Renny-Byfield S, Chester M, Jordon-Thaden IE, Viccini LF, Chamala S, Leitch AR, Schnable PS, Barbazuk WB, Soltis PS, Soltis DE: Next-generation sequencing and genome evolution in allopolyploids. Amer J Bot. 2012, 99: 372-382. 10.3732/ajb.1100395.

The Potato Sequencing Consortium: Genome sequence and analysis of the tuber crop potato. Natuur. 2011, 475: 189-197. 10.1038/nature10158.

Doyle J: DNA protocols for plants-CTAB total DNA isolation. Molecular techniques in taxonomy. Edited by: Hewitt GM, Johnston A. 1991, Springer, Berlin, 283-293.

Posada D, Crandall KA: Modeltest: testing the model of DNA substitution. Bioinformatics. 1998, 14: 817-818. 10.1093/bioinformatics/14.9.817.

Staden R: The Staden sequence analysis package. Mol Biotechnol. 1996, 5: 233-241. 10.1007/BF02900361.

Thompson JD, Gibson TJ, Plewniak F, Jeanmougin F, Higgins DG: The ClustalX windows interface: flexible strategies for multiple sequence alignment aided by quality analysis tools. Nucleïnezuren Res. 1997, 24: 4876-4882.

Maddison DR, Maddison WP: MacClade 4.03: Analysis of phylogeny and character evolution. 2001, Sinauer Associates, Suderland

Heled J, Drummond AJ: Bayesian inference of species trees from multilocus data. Mol Biol Evol. 2010, 27: 570-580. 10.1093/molbev/msp274.

Paradis E, Claude J, Strimmer K: APE: analyses of phylogenetics and evolution in R language. Bioinformatics. 2004, 20: 289-290. 10.1093/bioinformatics/btg412.

R Development Core Team: R: A language and environment for statistical computing. 2011, R Foundation for Statistical Computing, Vienna, Austria, ISBN 3-900051-07-0, URL http://www.R-project.org/.

Liu L, Yu L: Estimating species trees from unrooted gene trees. Syst Biol. 2011, 65: 661-667.

Saitou N, Nei M: The neighbor-joining method: a new method for reconstructing phylogenetic trees. Mol Biol Evol. 1987, 4: 406-425.

Desper R, Gascuel O: Fast and accurate phylogeny reconstruction algorithms based on the minimum-evolution principle. J Comput Biol. 2002, 9: 687-705. 10.1089/106652702761034136. software available: www.atgc-montpellier.fr/fastme/

Gascuel O, Steel M: Neighbor-joining revealed. Mol Biol Evol. 2006, 23: 1997-2000. 10.1093/molbev/msl072.

Desper R, Gascuel O: Theoretical foundation of the balanced minimum evolution method of phylogenetic inference and its relationship to weighted least-squares tree fitting. Mol Biol Evol. 2004, 21: 587-598.


Genes Types: Top 17 Types of Genes (With Role and Activity)

The below mentioned article will highlight the seventeen important types of genes with regard to their role and activity. The seventeen important types of genes are:

(1) House Keeping Genes (2) Non-constitutive Genes (3) Inducible Genes (4) Repressible Genes (5) Multi-genes (6) Repeated Genes (7) Single Copy Genes (8) Pseudo-genes (9) Processed Genes (10) Split Genes (11) Transposons (12) Overlapping Genes (13) Structural Genes (14) Regulator Genes (15) Operator Genes (16) Promoter Genes and (17) Terminator Genes.

1. House Keeping Genes (Constitutive Genes):

They are those genes which are constantly expressing themselves in a cell because their products are required all the time for the normal cellular activities, e.g., genes for glycolysis, ATP-ase.

2. Non-constitutive Genes (Luxury Genes):

The genes are not always expressing themselves in a cell. They are switched on or off according to the requirement of cellular activities, e.g., gene for nitrate reductase in plants, lactose system in Escherichia coli. Non-constitutive genes are of further two types, inducible and repressible.

3. Inducible Genes:

The genes are switched on in response to the presence of a chemical substance or inducer which is required for the functioning of the product of gene activity, e.g., nitrate for nitrate reductase.

4. Repressible Genes:

They are those genes which continue to express themselves till a chemical (often an end product) inhibits or represses their activity. Inhibition by an end product is known as feedback repression.

5. Multi-genes (Multiple Gene Family):

It is a group of similar or nearly similar genes for meeting requirement of time and tissue specific products, e.g, globin gene family (ε, δ, β, γ, on chromosome 11, α and δ on chromosome 16).

6. Repeated Genes:

The genes occur in multiple copies, e.g., histone genes, tRNA genes, rRNA genes, actin genes.

7. Single Copy Genes:

The genes are present in single copies (occasionally 2-3 times). They form 60-70% of the functional genes. Duplications, mutations and exon reshuffling between two genes form new genes.

8. Pseudo-genes:

They are genes which have homology to functional genes but are unable to produce functional products due to intervening nonsense codons, insertions, deletions and inactivation of promoter regions, e.g., several of snRNA genes.

9. Processed Genes:

They are eukaryotic genes which lack introns. Processed gene have been formed probably due to reverse transcription or retroviruses. Processed genes are generally nonfunctional as they lack promoters.

10. Split Genes:

Usually a gene has a continuous sequence of nucleotides. In other words, there is no interruption in the nucleotide sequence of a gene. Such nucleotide sequence codes for a particular single polypeptide chain. However, it was observed that the sequence of nucleotides was not continuous in case of some genes, the sequences of nucleotides were interrupted by intervening sequences. Such genes with interrupted sequence of nucleotides are referred to as split genes or interrupted genes. Thus, split genes have two types of sequences, viz., normal sequences and interrupted sequences (Fig. 8.3).

(i) Normal Sequence:

This represents the sequence of nucleotides which are included in the mRNA which is translated from DNA of split gene (Fig. 8.3). These sequences code for a particular polypeptide chain and are known as exons (or coding sequences).

(ii) Interrupted Sequence:

The intervening or interrupted non-coding sequences of split gene are known as introns (or Junk DNA). These sequences do not code for any peptide chain. Moreover, interrupted sequences are not included in mRNA which is transcribed from DNA of split genes.

The interrupted sequences are removed from the mRNA during processing of the same (Fig. 8.3). In other words, the intervening sequences are discarded in mRNA as they are non-coding sequences. The coding sequences or exons are joined by ligase enzyme.

Split genes are characteristic of eukaryotes. However, certain eukaryotic genes are completely exonic or non-split, e.g., histone genes, interferon genes. Split genes have also been recorded in some prokaryotes, such as thymidylate synthase gene and ribonucleotide reductase gene in T4. Split genes were discovered in 1977 by many workers but main credit was given to Philip Sharp and Richard J. Roberts (1997). They, for the first time, reported split genes in mammalian viruses (viz., adenoviruses) and were awarded Nobel prize.

11. Transposons (Jumping Genes Hedges and Jacob, 1974):

They are segments of DNA that can jump or move from one place in the genome to another. Transposons were first discovered by Mc Clintock (1951) in case of Maize when she found that a segment of DNA moved into gene coding for pigmented kernels and produced light coloured kernels. Transposons possess repetitive DNA, either similar or inverted, at their ends, some 5, 7 or 9-nucleotide long. Enzyme transposes separates the segment from its original by cleaving the repetitive sequences at its ends.

12. Overlapping Genes:

A few genes in certain bacteria and animal viruses code for two different polypeptides. These are called overlapping genes, e.g., in φ x 174 genes B, E and K overlap other genes.

13. Structural Genes (Cistrons):

These genes code for chemical substances which contribute to morphological or functional trait of the cell. These are now-a-days called cistrons. They are continuous in prokaryotes and split into introns and exons in eukaryotes.

Ze bevatten:

(i) Polypeptide-coding Genes:

These code for mRNAs which in turn code for polypeptides. Polypeptide may act as a component of an organelle, such as actin of muscle fibre an enzyme such as DNA polymerase a receptor or carrier protein of cell membrane a transport protein such as hemoglobin a hormone such as insulin, “an antibody” or antigen.

(ii) Polyprotein-coding Genes:

These genes code for more than one polypeptide per gene.

These code for rRNAs and tRNAs. They are tandemly repeated in the chromosomes.

14. Regulator Genes:

These genes code for repressor proteins for regulating the transcription of cistrons.

15. Operator Genes:

An operator gene acts as a switch to turn on or off the transcription of a structural gene as and when the cell requires.

16. Promoter Genes:

These genes are DNA sequences (sites) where RNA polymerase binds for the transcription of RNAs by the structural genes.

17. Terminator Genes:

These genes are DNA regions where RNA polymerase activity stops to suspend transcription of structural genes.

Gerelateerde artikelen:

Welkom bij BiologieDiscussie! Onze missie is om een ​​online platform te bieden om studenten te helpen bij het delen van aantekeningen in biologie. Deze website bevat studienotities, onderzoekspapers, essays, artikelen en andere verwante informatie die is ingediend door bezoekers zoals JIJ.

Lees de volgende pagina's voordat u uw kennis op deze site deelt:

Vragen

Inhoudsopgave

About Us

Suggesties

Nieuwe vragen en antwoorden en forumcategorieën

Dit is een vraag- en antwoordforum voor studenten, docenten en algemene bezoekers voor het uitwisselen van artikelen, antwoorden en notities. Beantwoord nu en help anderen.


TaqMan Endogenous Control Assays

An endogenous control gene shows expression levels that are relatively constant and moderately abundant across tissues, cell types, and treatment protocols. Such genes are also known as normalizer genes, housekeeping genes, and reference genes. Normalization to endogenous control genes is currently the most accurate method to correct for potential biases that are caused by:

  • Sample collection
  • Variation in the amount of starting material
  • Reverse transcription (RT) efficiency
  • Nucleic acid (RNA/DNA) preparation and quality

No single gene can act as a universal endogenous control for all experimental conditions, so we recommend verifying the chosen endogenous control or set of controls for the sample tissue, cell, or treatment. TaqMan Endogenous Control Assays are a collection of assays targeting genes that are commonly used in quantitative PCR gene expression experiments.

Individual TaqMan Endogenous Control Assays

Certain genes such as ACTB, GAPDH, and 18S are commonly used as endogenous controls. Choosing from these popular genes increases your chances of finding a suitable endogenous control. Testing at least 2-3 candidate endogenous controls is recommended. Ordering individual TaqMan Endogenous Control assays is a cost-effective solution for testing a small number of candidates across many samples. Use the assay selector tool below to see a list of popular endogenous control candidates, or use our Assay Search Tool to perform a more thorough search for all assays targeting a certain gene.

TaqMan Endogenous Control array plates and cards

If there is uncertainty around which endogenous control is most accurate for a specific experiment, endogenous control candidates may be tested in an easy, economical way using TaqMan arrays. We offer endogenous control panels in standard 96-well array plates, Fast 96-well array plates, and TaqMan array cards. These arrays may be purchased individually, maximizing flexibility to test as few or as many samples as needed. Once the candidate gene with the lowest variation has been identified from the array data, the individual TaqMan Endogenous Control Assay for that gene may be purchased for the final experiment.


Real-time PCR based on single-copy housekeeping genes for quantitative detection of goat meat adulteration with pork

Adulteration of goat meat with cheaper meat such as pork has been frequently found. Conventional PCR methods to distinguish goat meat from adulteration are qualitative, which easily produce false-positive results due to contamination but not adulteration. To address this problem, real-time PCR based on single-copy housekeeping genes encoding replication protein A1 was developed for goat meat and pork. By calculating the Ct ratio of goat meat/pork, the goat meat content in a suspected adulteration could be deduced by a good linear correlation (R 2 = 0.9868) in a range from 5% to 80%. Analysis of the simulated samples of goat meat showed high accuracy with recoveries of 104.91% and 105.00% for the goat meat contents of 40% and 60%, respectively, and coefficient of variations were as low as 9.24% and 9.09%. Thus, the developed assay supplied a useful tool for food regulation authorities to achieve quantitative authentication of goat meat.


Bekijk de video: Transcription. RNA synthesis. RNA polymerase (December 2021).