Informatie

Waarom zijn de genomen van mensen 99,5% hetzelfde?


Men zegt dat de DNA-sequentie van de mens ongeveer 99,5% gelijk is. Voor zover ik het begrijp, betekent dit dat als ik naar je toe zou lopen en ons DNA zou vergelijken, de volgorde van basenparen 99,5% hetzelfde zou zijn.

Mijn vraag is: Waarom is er slechts 0,5% variatie in ons DNA? Ik kan twee redenen bedenken:

  1. Om de een of andere reden zit de andere 99,5% (ruwweg) vast. Deze secties, als ze worden gewijzigd, resulteren ofwel in dat we niet 'mens' zijn, of ze krijgen gewoon een soort genetische ziekte en zijn dus niet erg goede mutaties.

  2. Er is niet genoeg tijd geweest. Ik herinner me dat ik lang geleden hoorde dat alle mensen een gemeenschappelijke voorouder hebben. Als dat het geval is, heeft misschien in de loop van de tijd slechts ongeveer 0,5% van ons DNA de tijd gehad om willekeurig te muteren, en als we echt heel erg lang wachten, zal meer en meer van ons DNA muteren, en zullen we minder op elkaar lijken. ander'.

Of begrijp ik de situatie helemaal verkeerd? Ik heb geen biologie gevolgd op de middelbare school, dus de antwoorden moeten eenvoudig zijn.


In een genoom van 3 miljard basenparen komt een verschil van 0,5% neer op een verschil van 15 miljoen basen. Wanneer een enkele baseverandering de aminozuurvolgorde van een eiwit kan veranderen, kan dat een enorme hoeveelheid diversiteit opleveren, wat we zien over de bijna 8 miljard mensen op de planeet, en de 99,5% gelijkheid is waarom we zijn als soort zo nauw met elkaar verbonden.

Hoe is het gebrek aan diversiteit te verklaren?

Niets in de biologie is logisch, behalve in het licht van de evolutie.

Het bovenstaande citaat is gemaakt door de evolutiebioloog Theodosius Dobzhansky. Wat dit in feite betekent, is dat je je vraag moet bekijken vanuit het perspectief van evolutie en natuurlijke selectie.

Het eerste dat u moet opmerken, is dat er aanwijzingen zijn dat de moderne mens door een bevolkingsprobleem is gegaan. Dat betekent dat er op een bepaald punt in onze geschiedenis maar heel weinig individuele leden van onze soort in leven waren en dit kan het 'gebrek' aan diversiteit verklaren dat we in ons genoom zien. Het aantal dat wordt geciteerd is zo laag als 10.000 individuen die in leven zijn gebleven na de superuitbarsting van de Toba-vulkaan ongeveer 75 duizend jaar geleden.

Dat betekent dat er nog maar heel weinig paarparen over waren, en dat verminderde de genetische diversiteit van onze soort aanzienlijk. Dit staat bekend als Founder-effect.

Oprichter effecten

Een stichtereffect treedt op wanneer een nieuwe kolonie wordt gesticht door enkele leden van de oorspronkelijke populatie. Deze kleine populatiegrootte betekent dat de kolonie kan hebben:

  • verminderde genetische variatie van de oorspronkelijke populatie.
  • een niet-willekeurige steekproef van de genen in de oorspronkelijke populatie.

Dus als we een gemiddelde van 20 tot 25 jaar per menselijke generatie gebruiken, kijken we slechts naar ongeveer 3.000 tot 4.000 generaties, aangezien er misschien maar een paar duizend broedparen van mensen waren. Vergelijk dat eens met bacteriën die in minder dan een week drie- tot vierduizend generaties kunnen doorlopen, en je kunt beginnen te begrijpen waarom er zoveel sequentiehomologie (gelijkheid) is in het menselijk genoom. Zie Knelpunten en oprichterseffecten op de Understanding Evolution-site van UC Berkley voor meer informatie.

U moet ook begrijpen dat alle wijzigingen die schadelijk zijn, onder sterke selectieve druk zullen staan. Dit betekent misschien niet dat het organisme niet overleeft om zich voort te planten, het kan alleen betekenen dat ze gemiddeld minder succesvol zijn; minder nakomelingen die minder nakomelingen hebben in vergelijking met de rest van de populatie. Op een gegeven moment kan die afstamming uitsterven, ofwel omdat de verandering het erg moeilijk maakt om te overleven, ofwel omdat de nakomelingen minder wenselijke partners vormen en uiteindelijk niet de kans krijgen om zich voort te planten.

Elke verandering die een vitaal gen verstoort, zal waarschijnlijk fataal zijn en zal leiden tot een spontane abortus of als de mutatie in een sperma werd aanhouden, dan zal het onvermogen van dat sperma om te overleven om een ​​eicel te bevruchten, dus het sperma dat zwaar gemuteerd was misschien nooit tot het ei komen. Het gemiddelde aantal zaadcellen in een enkele menselijke ejaculatie is ongeveer 250 miljoen. En toch haalt slechts één enkele zaadcel het om de eicel te bevruchten, en dat veronderstelt dat er een bevruchtingsgebeurtenis plaatsvindt. Er is een ongelooflijke hoeveelheid selectie die plaatsvindt tijdens de voortplanting, zelfs voordat we tot ontwikkeling komen.

Waarom het cijfer van 99,5% tot 0,5% een verkeerde voorstelling geeft van de bevolking als geheel.

Een ander ding waar u over wilt nadenken, is hoe het getal van 0,5% tot 99,5% is bereikt. De verwijzing in de vraag verwijst naar een Wikipedia-artikel Human Genetic Variation. De verwijzing hiervoor was afkomstig uit een artikel in de New York Times over J. Craig Venter, In the Genome Race, the Sequel Is Personal - Wade, Nicholas. 4 september 2007. Het citaat dat referenties zijn in Wikipedia is:

Biologen hadden geschat dat twee individuen identiek zouden zijn in 99,9 procent van hun DNA, maar het werkelijke cijfer blijkt nu veel minder te zijn, ongeveer 99,5 procent, zei Dr. Scherer.

Het cijfer van 0,5% is een citaat van Stephen W. Scherer, die medeauteur was van dit artikel, The Diploid Genome Sequence of an Individual Human, Levy, et.al. PLoS-biologie; 4 september 2007. DOI: 10.1371/journal.pbio.0050254. Uit dat document is het volgende citaat te vinden:

Het opnemen van genetische variatie van insertie en deletie in onze schattingen van interchromosomale verschillen onthult dat er slechts 99,5% overeenkomst bestaat tussen de twee chromosomale kopieën van een individu en dat genetische variatie tussen twee individuen maar liefst vijf keer hoger is dan eerder werd geschat.
- De diploïde genoomsequentie van een individuele mens, Levy, et.al. PLoS-biologie; 4 september 2007.
DOI: 10.1371/journal.pbio.0050254

Dus op zijn minst werd de verklaring afgelegd in een peer-reviewed artikel. Hier zijn echter enkele problemen mee.

De eerste is de methode van het papier. Het kijkt naar een enkel menselijk genoom, dat van Dr. Venter, en wordt gebruikt om de conclusie te trekken van een verschil van 0,5% tussen twee willekeurige personen. En de vergelijking is gemaakt op basis van de analyse van verschillen tussen de moederchromosomen van Dr. Venter en de chromosomen van de vader. Laten we eens kijken wat de problemen hier kunnen zijn:

  • Het is een enorme sprong in statistisch geloof om aan te nemen dat een enkel genoom representatief is voor de bijna 8 miljard genomen die er zijn.
  • De genealogie van Dr. Venter is Engels voor beide ouderlijnen. We moeten niet vergeten dat er in het Europa van de middeleeuwen nog een ander bevolkingsprobleem was, veroorzaakt door uitbraken van cholera en de Zwarte Dood. Dit feit kan impliceren dat de afstammingslijnen van Dr. Venter genetisch dicht bij elkaar liggen en dat als zijn afstamming meer divers was, zeg maar inheems Oceanië en Engels, ze een veel hoger percentage verschil tussen maternale en vaderlijke chromosomen zouden hebben gevonden.

De stamboom van de drie generaties van de donor wordt weergegeven in figuur 1A. De donor heeft drie broers en zussen en een biologische zoon, zijn vader stierf op 59-jarige leeftijd aan een plotselinge hartstilstand. Er zijn gedocumenteerde gevallen van familieleden met chronische ziekten, waaronder hypertensie en eierstok- en huidkanker. Volgens de genealogische gegevens kunnen de voorouders van de donor worden getraceerd tot 1821 (vaderlijk) en de 18e eeuw (moederlijk) in Engeland. Genotypering en clusteranalyse van 750 unieke SNP-loci ontdekte via dit projectondersteuning dat de donor inderdaad 99,5% vergelijkbaar is met individuen van Europese afkomst (Figuur 1B), consistent met zelfrapportage.
- De diploïde genoomsequentie van een individuele mens, Levy, et.al. PLoS-biologie; 4 september 2007.
DOI: 10.1371/journal.pbio.0050254

  • Dr. Venter is een man. Het Y-chromosoom was problematisch om te sequensen, en je kunt het niet echt vergelijken met het X-chromosoom. Hoe zou het genoom van een vrouw te vergelijken zijn?

Het Y-chromosoom wordt voor 59% gedekt door de één-op-één-mapping vanwege problemen bij het maken van vergelijking tussen herhaalde rijke chromosomen. Bovendien is het Y-chromosoom slechter bedekt vanwege de moeilijkheden bij het samenstellen van complexe regio's met een sequentiëringsdiepte van slechts de helft van die van het autosomale deel van het genoom. De X-chromosoomdekking met HuRef-steigers is 95,2%, wat typerend is voor het dekkingsniveau van autosomen (gemiddeld 98,3% bij gebruik van runs). Het is echter duidelijk dat het X-chromosoom meer hiaten heeft, zoals blijkt uit de dekking met overeenkomsten (89,4%) vergeleken met de gemiddelde dekking van autosomen die overeenkomsten gebruiken (97,1%). De algemene effecten van een lagere sequentiedekking op chromosomen X en Y zijn duidelijk zichtbaar als een sterke toename van het aantal gaten per lengte-eenheid en kortere steigers in vergelijking met de autosomen (Figuur 3). Overeenkomsten tussen de geslachtschromosomen is een andere bron van problemen bij het samenstellen en in kaart brengen. Er is bijvoorbeeld een steiger van 1,5 Mb die even goed wordt toegewezen aan identieke regio's van de X- en Y-chromosomen en daarom niet uniek kan worden toegewezen aan een van beide (zie materialen en methoden en figuur 3). Uit onze één-op-één kaartgegevens zijn we ook in staat om de verrijking van grote segmentale duplicaties 10 op Chromosomen 9, 16 en 22 te detecteren, wat resulteert in verminderde dekking op basis van problemen bij assemblage en mapping (Tabel S3).
- De diploïde genoomsequentie van een individuele mens, Levy, et.al. PLoS-biologie; 4 september 2007.
DOI: 10.1371/journal.pbio.0050254

Er is nog iets dat je moet onthouden en dat is de geschiedenis van het Human Genome Project. Dr. Venter ontwikkelde een nieuwe methode van sequencing en werd een commerciële concurrent van het International Human Genome Sequencing Consortium-project. Terwijl het project van het International Human Genome Sequencing Consortium de onderneming van Dr. Venter(8) versloeg, is het zijn benadering om, om de anonimiteit te bewaren, gebruik te maken van een samensmelting van het DNA van vele donoren, van wie sommigen hun DNA hadden opgenomen en anderen niet. Venter omzeilde dit door de sequencing uit te voeren op zijn eigen DNA. Toen zijn team werd verslagen door het International Human Genome Sequencing Consortium, verdubbelde hij, investeerde meer tijd en moeite en kwam met de sequentie die in dit artikel wordt beschreven, die een hogere resolutie had dan eerdere inspanningen. De paper pleit voor de waarde van hun techniek ten opzichte van de technieken die worden gebruikt door het International Human Genome Sequencing Consortium en probeert de superioriteit van hun methode te claimen. De gepresenteerde gegevens zijn waarschijnlijk feitelijk, maar vanwege deze geschiedenis moet je kijken naar het papier, de methoden en de motieven erachter.

Het is pas 15,5 jaar geleden dat we een volledige versie van een Human Genome Project hadden, geproduceerd door het International Human Genome Sequencing Consortium. Om dat genoom te sequensen werden monsters genomen van een paar honderd individuen. Van kleine stukjes DNA werd de sequentie bepaald en vervolgens werden al die stukjes in de computer samengevoegd. Dat betekent dat er veel middeling is gebeurd. Dus werd standaard de meest voorkomende basis in de populatie vrijwilligers op elke positie gekozen. Dat betekent dat dat ook representatief moet zijn voor de rest van de bevolking.

Wanneer we uitspraken doen over vergelijkingen in datasets zo groot als het menselijk genoom, kijken we vaker wel dan niet naar bekende, kleine subsets van het genoom, en we extrapoleren met statistische methoden die op dat feit zijn gebaseerd. Een ding dat je leert als je wetenschappelijke artikelen leest, en niet alleen wetenschappelijke nieuwsartikelen, is dat je altijd naar hun materialen en methoden moet kijken om te bepalen hoe ze aan hun gegevens en kopnummers zijn gekomen. Er wordt vaak geciteerd dat we slechts een verschil van 1,5% hebben tussen mensen en chimpansees, maar als je naar die papieren kijkt, werden de vergelijkingen alleen gedaan op gebieden van de genomen die goed op één lijn lagen. Dat wil niet zeggen dat er geen opmerkelijke mate van overeenkomst is tussen ons en ons naaste levende evolutionaire familielid, het is gewoon dat er meer aan de hand is dan de kop.

We hebben ook niet zoveel volledige genomen waarvan de sequentie is bepaald om met elkaar te vergelijken, als percentage van de 8 miljard mensen die vandaag leven. Hoewel we vertegenwoordigingen hebben van de meeste van de geïdentificeerde etnische groepen, missen we mogelijk families met nieuwe afstammingslijnen.

Iets anders waar je aan moet denken, is dat veel van de gebieden in het menselijk genoom herhalingen en structurele elementen zijn die niet coderen voor genen die genexpressie beïnvloeden. Dingen zoals telomeren, die de uiteinden van chromosomen beschermen, en centromeren, de bevestigingspunten op chromosomen die ervoor zorgen dat ze goed worden verdeeld in nieuw verdeelde cellen. Deze elementen blijven meestal hetzelfde omdat de eiwitten die eraan binden die sequentiespecificiteit nodig hebben om goed te kunnen functioneren, dus dat zijn regio's waar bijna iedereen hetzelfde DNA zal hebben, en niet alleen tussen mensen. Deze elementen lijken vaak erg op elkaar bij de meeste gewervelde dieren.

We moeten ook rekening houden met structurele RNA's. Deze moleculen hebben functies in de cel die vereisen dat hun sequenties sterk geconserveerd (onveranderd) zijn. Ribosomale RNA's, transfer-RNA's, kleine nucleaire RNA's vertrouwen allemaal op hun specifieke sequentie om correct te vouwen om hun taak in de cel uit te voeren. Een enkele baseverandering kan de vouwing van deze elementen veranderen en als gevolg daarvan verliezen ze hun functie, waardoor die cellen niet in staat zullen zijn om op de juiste manier eiwitten te produceren, wat betekent dat de cellen zullen afsterven. Als dit gebeurt in kiembaancellen, dan zullen ze niet betrokken zijn bij de bevruchting, dus eventuele mutaties zullen daar worden doorgegeven.

Ik zou door kunnen gaan, maar de conclusie is dat het niet verwonderlijk is dat er binnen de menselijke soort heel weinig sequentiediversiteit is op een percentagebasis, maar er zijn ook veel kanttekeningen bij dat feit.

Bewerking: Aanzienlijke bewerkingen om relevante informatie toe te voegen waarnaar wordt verwezen als back-up van het antwoord.


Genetische overeenkomsten binnen en tussen menselijke populaties

Het aandeel van menselijke genetische variatie als gevolg van verschillen tussen populaties is bescheiden, en individuen uit verschillende populaties kunnen genetisch meer op elkaar lijken dan individuen uit dezelfde populatie. Toch kunnen voldoende genetische gegevens nauwkeurige classificatie van individuen in populaties mogelijk maken. Beide bevindingen kunnen worden verkregen uit dezelfde dataset, met hetzelfde aantal polymorfe loci. In dit artikel wordt uitgelegd waarom. Onze analyse richt zich op de frequentie, ω, waarmee een paar willekeurige individuen uit twee verschillende populaties genetisch meer op elkaar lijken dan een paar individuen die willekeurig zijn geselecteerd uit een enkele populatie. We vergelijken ω met de foutenpercentages van verschillende classificatiemethoden, met behulp van datasets die variëren in aantal loci, gemiddelde allelfrequentie, bemonsterde populaties en polymorfismebepalingsstrategie. We laten zien dat classificatiemethoden een hoger onderscheidend vermogen hebben dan ω vanwege het gebruik van geaggregeerde eigenschappen van populaties. Het aantal geanalyseerde loci is de meest kritische variabele: met 100 polymorfismen is nauwkeurige classificatie mogelijk, maar ω blijft aanzienlijk, zelfs bij gebruik van zo verschillende populaties als Sub-Sahara Afrikanen en Europeanen. Van fenotypen die worden gecontroleerd door een tiental of minder loci kan daarom worden verwacht dat ze een aanzienlijke overlap tussen menselijke populaties vertonen. Dit biedt empirische rechtvaardiging voor voorzichtigheid bij het gebruik van populatielabels in biomedische instellingen, met brede implicaties voor gepersonaliseerde geneeskunde, farmacogenetica en de betekenis van ras.

DISCUSSIES over genetische verschillen tussen grote menselijke populaties werden lange tijd gedomineerd door twee feiten: (a) Dergelijke verschillen verklaren slechts een klein deel van de variantie in allelfrequenties, maar niettemin (b) multilocusstatistieken wijzen de meeste individuen aan de juiste populatie toe. Dit wordt algemeen beschouwd als een weerspiegeling van het toegenomen discriminerende vermogen van multilocus-statistieken. Toch B amshad et al. (2004) toonden aan, met behulp van multilocus-statistieken en bijna 400 polymorfe loci, dat (c) paren van individuen uit verschillende populaties vaak meer op elkaar lijken dan paren uit dezelfde populatie. Als multilocus-statistieken zo krachtig zijn, hoe moeten we deze bevinding dan begrijpen?

Alle drie de hierboven genoemde claims verschijnen in geschillen over het belang van variatie in de menselijke populatie en 'ras'. In het bijzonder verklaarde de A merican A nthropological Association (1997, p. 1) dat "gegevens ook aantonen dat twee individuen binnen een bepaalde populatie genetisch even verschillend zijn als twee mensen die zijn geselecteerd uit twee populaties in de wereld" (vervolgens gewijzigd in "ongeveer even anders"). Evenzo stelt educatief materiaal dat wordt verspreid door het H uman G enome P roject (2001, p. 812) dat "twee willekeurige individuen uit een bepaalde groep bijna net zo verschillend zijn [genetisch] als twee willekeurige individuen van de hele wereld." Voorheen zou men kunnen hebben geoordeeld dat deze uitspraken in wezen correct zijn voor tekens met één locus, maar niet voor multilocus-tekens. Echter, de vondst van B amshad et al. (2004) suggereert dat een empirisch onderzoek van deze claims gerechtvaardigd is.

In wat volgt, gebruiken we verschillende verzamelingen van loci gegenotypeerd in verschillende menselijke populaties om de relatie tussen claims a, b en c hierboven te onderzoeken. Deze datasets variëren in het aantal gegenotypeerde polymorfe loci, strategieën voor populatiebemonstering, methoden voor het vaststellen van polymorfisme en gemiddelde allelfrequenties. Om claim c te beoordelen, definiëren we ω als de frequentie waarmee een paar individuen uit verschillende populaties genetisch meer op elkaar lijken dan een paar uit dezelfde populatie. We laten zien dat claim c, de waarneming van hoge ω, geldt voor kleine verzamelingen loci. Het geldt zelfs voor honderden loci, vooral als de bemonsterde populaties niet lang van elkaar zijn geïsoleerd. Het valt echter uiteen met datasets die duizenden loci bevatten die zijn gegenotypeerd in geografisch verschillende populaties: in dergelijke gevallen wordt ω nul. Classificatiemethoden leveren op vergelijkbare wijze hoge foutenpercentages op met weinig loci en bijna geen fouten met duizenden loci. In tegenstelling tot ω maken classificatiestatistieken echter gebruik van geaggregeerde eigenschappen van populaties, zodat ze 100% nauwkeurigheid kunnen benaderen met slechts 100 loci.


Genetische gevoeligheid voor ernstige symptomen van coronavirus

De meeste mensen ervaren slechts milde symptomen wanneer ze COVID-19 hebben, maar een minderheid zal een ernstige of levensbedreigende reactie hebben. Hoewel een deel van het verschil kan worden verklaard door hogere risicofactoren zoals een hogere leeftijd of onderliggende gezondheidsproblemen, is de reden waarom sommige jonge mensen zo ziek worden, een van de puzzels van de COVID-19-pandemie.

Sommige antwoorden zouden in het menselijk genoom kunnen liggen. Het genoom is de handleiding van het lichaam die alle informatie bevat die nodig is om een ​​individu te maken, te onderhouden en te repareren. Er is een kopie ervan in bijna alle menselijke cellen. Het is gemaakt van DNA, dat we van onze ouders erven.

Genen in het genoom kunnen afzonderlijk werken, maar werken veel vaker samen, zoals spelers in een orkest. Ze hebben ook interactie met de omgeving. In de zon neemt bijvoorbeeld de activiteit van genen die betrokken zijn bij de bescherming van de huid tegen schade door UV-licht toe.

Elke twee mensen hebben genomen die ongeveer 99,9% hetzelfde zijn, het is de resterende 0,1% die ze anders maakt. Deze variatie kan belangrijk zijn om te bepalen hoe verschillende mensen op bepaalde infecties reageren. Wanneer mensen bijvoorbeeld besmet zijn met het coronavirus, zullen fragmenten van het virus door het immuunsysteem worden gezien op een manier die van persoon tot persoon kan verschillen. Het resultaat zou een variatie in de immuunrespons op infectie kunnen zijn.

Menselijke genen die betrokken zijn bij de reactie op infectie zijn talrijk en zeer divers binnen het genoom. Sommige bevinden zich op het X-chromosoom en dit zou een reden kunnen zijn waarom mannen (die slechts één exemplaar van X hebben) ernstiger worden getroffen door COVID-19-infectie dan vrouwen (die twee exemplaren hebben). Variaties in menselijke genomen, zowel genen van het immuunsysteem als andere, zouden op zijn minst enkele van de verschillen in reacties op coronavirusinfectie kunnen verklaren. Ze kunnen ook helpen om verschillen te verklaren in hoe patiënten reageren op behandelingen voor COVID-19.


Wetenschappers die door het genoom van mensen, vliegen en wormen kijken, vinden gedeelde biologie

Studies onthullen krachtige overeenkomsten in biologische activiteit, regulering tussen soorten.

Onderzoekers die het genoom van mensen, vliegen en wormen analyseren, hebben ontdekt dat deze soorten een aantal belangrijke genomische processen gemeen hebben, die hun gedeelde voorouders weerspiegelen. De bevindingen verschijnen op 28 augustus 2014 in het tijdschrift Natuur, bieden inzicht in embryonale ontwikkeling, genregulatie en andere biologische processen die essentieel zijn voor het begrijpen van de menselijke biologie en ziekte.

De onderzoeken benadrukken de gegevens die zijn gegenereerd door het modENCODE-project en het ENCODE-project, beide ondersteund door het National Human Genome Research Institute (NHGRI), onderdeel van de National Institutes of Health. Door gegevens van de drie soorten te integreren, bestudeerde het modelorganisme ENCyclopedia Of DNA Elements (modENCODE) Consortium hoe genexpressiepatronen en regulerende eiwitten die het lot van cellen helpen bepalen, vaak gemeenschappelijke kenmerken delen. Onderzoekers hebben ook de vergelijkbare manieren beschreven waarop de drie soorten eiwitverpakkingen gebruiken om DNA in de celkern te compacteren en om de genoomfunctie te reguleren door de toegang tot DNA te regelen.

Het doel van modENCODE, gelanceerd in 2007, is om een ​​uitgebreide catalogus van functionele elementen in het genoom van fruitvliegen en rondwormen te creëren voor gebruik door de onderzoeksgemeenschap. Dergelijke elementen omvatten genen die coderen voor eiwitten, niet-eiwitcoderende genen en regulerende elementen die genexpressie regelen. Het huidige werk bouwt voort op de eerste catalogi die in 2010 zijn gepubliceerd. De modENCODE-projecten vormen een aanvulling op het werk van het ENCyclopedia Of DNA Elements (ENCODE)-project, dat een uitgebreide catalogus van functionele elementen in het genoom van mensen en muizen bouwt.

"De modENCODE-onderzoekers hebben onderzoekers over de hele wereld een waardevolle hulpbron geboden", zegt NHGRI-directeur Eric Green, M.D., Ph.D. "De inzichten die zijn verkregen over de werking van de genomen van modelorganismen helpen enorm om ons begrip van de menselijke biologie te informeren."

"Een manier om het menselijk genoom te beschrijven en te begrijpen is door vergelijkende genomica en het bestuderen van modelorganismen", zegt Mark Gerstein, Ph.D., Albert L. Williams hoogleraar biomedische informatica aan de Yale University in New Haven, Connecticut, en de hoofdauteur op een van de papieren. "Het speciale aan de worm en vlieg is dat ze evolutionair erg ver verwijderd zijn van mensen, dus het vinden van iets dat bewaard is gebleven in alle drie - mens, vlieg en worm - vertelt ons dat het een heel oud, fundamenteel proces is."

In één onderzoek analyseerden wetenschappers onder leiding van Dr. Gerstein en anderen menselijke, vliegen- en wormtranscriptomen, de verzameling gentranscripten (of uitlezingen) in een genoom. Ze gebruikten grote hoeveelheden genexpressiegegevens die werden gegenereerd in de ENCODE- en modENCODE-projecten - waaronder meer dan 67 miljard gensequentie-uitlezingen - om genexpressiepatronen te ontdekken die door alle drie soorten worden gedeeld, met name voor ontwikkelingsgenen.

Onderzoekers toonden aan dat de manieren waarop DNA in de cel wordt verpakt in veel opzichten vergelijkbaar zijn, en in veel gevallen delen de soorten programma's om genen op een gecoördineerde manier aan en uit te zetten. Meer specifiek gebruikten ze genexpressiepatronen om de stadia van de ontwikkeling van wormen en vliegen te matchen en vonden sets van genen die met elkaar overeenkomen in hun gebruik. Ze ontdekten ook dat de genen die specifiek tot expressie worden gebracht in de worm en vliegenembryo's opnieuw tot expressie worden gebracht in de vliegenpoppen, het stadium tussen larve en adult.

De onderzoekers ontdekten dat in alle drie de organismen de genexpressieniveaus voor zowel eiwitcoderende als niet-eiwitcoderende genen kwantitatief konden worden voorspeld op basis van chromatinekenmerken bij de promotors van genen. De promotor van een gen vertelt de machinerie van de cel waar te beginnen met het kopiëren van DNA naar RNA, dat kan worden gebruikt om eiwitten te maken. DNA is verpakt in chromatine in cellen en veranderingen in deze verpakking kunnen de genfunctie reguleren.

"Onze bevindingen openen hele nieuwe werelden voor het begrijpen van genexpressie en hoe we denken over de rol van transcriptie", zegt co-senior auteur Susan Celniker, Ph.D., hoofd, Department of Genome Dynamics, Lawrence Berkeley National Laboratory, Berkeley, Californië . "modENCODE is transformatief geweest", voegde ze eraan toe. "Het heeft geholpen de norm te bepalen voor de soorten gegevens die moeten worden gegenereerd en gecatalogiseerd."

Een andere groep wetenschappers onderzocht hoe chromatine is georganiseerd en hoe het de genregulatie van de drie soorten beïnvloedt. Met behulp van zowel modENCODE- als ENCODE-gegevens vergeleken wetenschappers patronen van modificaties in chromatine die nodig zijn voor de cel om toegang te krijgen tot het DNA binnenin, en de veranderingen in DNA-replicatiepatronen als gevolg van deze modificaties. De onderzoekers ontdekten dat veel kenmerken van chromatine in alle drie de soorten vergelijkbaar waren.

"We ontdekten meestal dat het gebruik van chromatine-modificatie door de drie organismen zeer geconserveerd is", zegt co-senior auteur Jason Lieb, Ph.D., hoogleraar menselijke genetica, Universiteit van Chicago. Hij merkte op dat er veel belangstelling is voor chromatine vanwege het mogelijke verband met sommige ziekten, zoals kanker. Een aantal onderzoeken heeft aangetoond dat sommige vormen van kanker gedeeltelijk kunnen worden veroorzaakt door mutaties in chromatine-gerelateerde genen.

In een derde studie onderzochten wetenschappers overeenkomsten in genoomregulatie. Wetenschappers concentreerden zich op transcriptieregulerende factoren, belangrijke eiwitregulatoren die bepalen welke voorlopercellen uiteindelijk huidcellen en niercellen en oogcellen worden. "Dit zijn de belangrijkste coördinatoren - ze binden zich aan schakelaars die het lot van een cel bepalen. Een van de grote vragen in genomica is om te bepalen welke factoren samenwerken om welke genen aan te zetten”, zegt co-senior auteur Michael Snyder, Ph.D., directeur, Stanford Center for Genomics and Personalised Medicine, Stanford University, Stanford, Californië .

Onderzoekers ontdekten dat de transcriptiefactoren de neiging hebben om te binden aan vergelijkbare DNA-sequenties in de genomen van de drie soorten, wat aangeeft dat "de algemene eigenschappen van hoe regulerende informatie in de genomen is vastgelegd, behouden blijven in de drie soorten", merkte Dr. Snyder op. "De algemene beginselen van regulering zijn min of meer vergelijkbaar." Toch vonden ze ook verschillen. De transcriptiefactoren binden zeer weinig van dezelfde doelen tussen soorten, en ze worden meestal op verschillende tijdstippen tot expressie gebracht.

Met inbegrip van deze nieuw gepubliceerde studies, zijn of zullen meer dan een dozijn artikelen van het modENCODE Consortium gepubliceerd worden in de tijdschriften Natuur, Genoomonderzoek, Genoombiologie en de procedures van de National Academy of Sciences dit jaar. Deze aanvullende artikelen rapporteren studies met diepere analyses binnen een of meer soorten, de ontwikkeling van methoden en onderzoek naar bepaalde biologische processen. Deze verzameling papers is het hoogtepunt van het modENCODE-programma, waarvoor de financiering in 2012 eindigde. Er zijn al meer dan 100 papers gepubliceerd die modENCODE-gegevens gebruiken door groepen buiten het programma. Verwacht wordt dat de gegevens en bronnen die door modENCODE worden geproduceerd, nog jarenlang door de bredere onderzoeksgemeenschap zullen worden gebruikt.


Gezondheid

Verschillen in allelfrequenties dragen bij aan groepsverschillen in de incidentie van sommige monogene ziekten, en ze kunnen bijdragen aan verschillen in de incidentie van sommige veel voorkomende ziekten (Risch et al. 2002 Burchard et al. 2003 Tate en Goldstein 2004). Voor de monogene ziekten correleert de frequentie van oorzakelijke allelen meestal het beste met de afkomst, of deze nu familiaal is (bijvoorbeeld het Ellis-van Creveld-syndroom bij de Pennsylvania Amish), etnisch (ziekte van Tay-Sachs onder Ashkenazi-joodse bevolkingsgroepen), of geografisch (hemoglobinopathieën onder mensen met voorouders die in malariagebieden leefden). Voor zover afkomst overeenkomt met raciale of etnische groepen of subgroepen, kan de incidentie van monogene ziekten verschillen tussen groepen die zijn ingedeeld naar ras of etniciteit, en beroepsbeoefenaren in de gezondheidszorg houden doorgaans rekening met deze patronen bij het stellen van diagnoses. [ citaat nodig ]

Zelfs bij veel voorkomende ziekten waarbij talrijke genetische varianten en omgevingsfactoren betrokken zijn, wijzen onderzoekers op bewijs dat de betrokkenheid van differentieel verdeelde allelen met kleine tot matige effecten suggereert. Veel aangehaalde voorbeelden zijn onder meer hypertensie (Douglas et al. 1996), diabetes (Gower et al. 2003), obesitas (Fernandez et al. 2003), en prostaatkanker (Platz et al. 2000). In geen van deze gevallen is echter aangetoond dat allelische variatie in een gevoeligheidsgen verantwoordelijk is voor een significant deel van het verschil in ziekteprevalentie tussen groepen, en de rol van genetische factoren bij het genereren van deze verschillen blijft onzeker (Mountain en Risch 2004).

Neil Risch van de Stanford University heeft voorgesteld dat een zelf-geïdentificeerd ras/etnische groep een geldig categoriseringsmiddel zou kunnen zijn in de VS voor volksgezondheids- en beleidsoverwegingen. [42] [43] Terwijl een artikel uit 2002 van de groep van Noah Rosenberg een soortgelijke bewering doet: "De structuur van menselijke populaties is relevant in verschillende epidemiologische contexten. Als gevolg van variatie in frequenties van zowel genetische als niet-genetische risicofactoren, ziektecijfers en van dergelijke fenotypes, zoals bijwerkingen van geneesmiddelen, variëren tussen populaties. Verder kan informatie over de populatie van herkomst van een patiënt zorgverleners informatie geven over risico's wanneer de directe oorzaken van de ziekte onbekend zijn." [44]


Sleutelbegrippen en samenvatting

  • De gehele genetische inhoud van een cel is zijn genoom.
  • genen coderen voor eiwitten, of stabiele RNA-moleculen, die elk een specifieke functie in de cel vervullen.
  • Hoewel de genotype die een cel bezit blijft constant, expressie van genen is afhankelijk van omgevingscondities.
  • EEN fenotype is de waarneembare kenmerken van een cel (of organisme) op een bepaald tijdstip en is het resultaat van het complement van genen die momenteel worden gebruikt.
  • Het grootste deel van het genetisch materiaal is georganiseerd in: chromosomen die het DNA bevatten dat cellulaire activiteiten regelt.
  • Prokaryoten zijn typisch haploïde, meestal met een enkel cirkelvormig chromosoom in de nucleoïde. Eukaryoten zijn diploïde DNA is georganiseerd in meerdere lineaire chromosomen die in de kern worden gevonden.
  • Supercoiling en DNA-verpakking met behulp van DNA-bindende eiwitten zorgen ervoor dat lange moleculen in een cel passen. Eukaryoten en archaea gebruiken histon-eiwitten en bacteriën gebruiken verschillende eiwitten met een vergelijkbare functie.
  • Prokaryote en eukaryote genomen bevatten beide: niet-coderend DNA, waarvan de functie niet goed wordt begrepen. Sommige niet-coderende DNA-moleculen lijken deel te nemen aan de vorming van kleine niet-coderende RNA-moleculen die de genexpressie beïnvloeden. Sommige lijken een rol te spelen bij het in stand houden van de chromosomale structuur en bij het inpakken van DNA.
  • Extrachromosomaal DNA in eukaryoten omvat de chromosomen die worden gevonden in organellen van prokaryotische oorsprong (mitochondriën en chloroplasten) die zijn geëvolueerd door endosymbiose. Sommige virussen kunnen zich ook extrachromosomaal handhaven.
  • Extrachromosomaal DNA in prokaryoten wordt gewoonlijk gehandhaafd als: plasmiden that encode a few nonessential genes that may be helpful under specific conditions. Plasmids can be spread through a bacterial community by horizontal gene transfer.
  • Viral genomes show extensive variation and may be composed of either RNA or DNA, and may be either double or single stranded.

Genes from our extinct relatives live on in modern humans

While all humans are remarkably similar at a genetic level &mdash on average any two individuals' genomes are 99.9% identical &mdash those differences that doen exist manifest themselves in the dazzling spectrum of human diversity. From a lithe tribesperson of the Kalahari, to a freckled redhead from Ireland, to a sleek-haired, ruddy-cheeked inhabitant of the Tibetan plateau, Homo sapiens come in many different shapes, sizes, hues, and appearances. While we tend to notice differences that are easy to spot, other "stealth" variations in human populations are not necessarily observable from physical appearance alone. For example, many people of African descent are resistant to infection from malaria, while that trait is much rarer among those who hail from other parts of the world. Now new research into Arctic-dwelling Inuit populations points to a surprising origin for one such "stealth" trait &mdash the ability to tolerate frigid temperatures.

Where's the evolution?

Just as other organisms have evolved adaptations that aid survival and reproduction in their unique environments &mdash finches evolving beaks shaped to eat the seeds that are plentiful, moths evolving wings that blend in with the bark of the trees where they sit &mdash so too have different human populations experienced natural selection shaping them in response to their environments. Random mutations occur, some of these mutations affect the traits of the organism that carries it, and sometimes the organism lives in an environment where that altered trait aids survival and reproduction. When that happens, the frequency of the mutation increases, generation by generation, as the descendants of the original carriers multiply in the population. That is the essence of evolution by natural selection. And that is how, for example, malaria-resistant African populations came about: a random mutation that happened to confer resistance to its carrier occurred, and when that mutation wound up in an individual living where malaria was common, that person left more offspring (who were also likely to carry the mutation) than did others. Additional traits adapting humans to different local environmental conditions are shown in the figure below.

Figure titled Global distribution of locally adaptive traits. Aangepast van Strength in small numbers by Sarah Tishkoff, illustrated by A. Cuadra/Science and Megan Rubel/Univ. of Pennsylvania 2015, Wetenschap, Vol. 349, Issue 6254, pp. 1282-1283 DOI: 10.1126/science.aad0584

One might expect the same to have happened among the Inuit with genes that affect cold tolerance. These indigenous people live in places where winter means an average daily temperature of around -20° F and only a few hours of light each day. Any trait that might help someone eke a living out of such a harsh environment would surely have been favored by natural selection. Indeed, researchers recently scanned the Inuit genome looking for areas that seem to have been acted on by natural selection and honed in on a few regions. One area contains genes that affect how the body processes fatty acids, which makes sense given that the seafood upon which the Inuit depend is unusually high in polyunsaturated fatty acids. Another contains genes related to body fat distribution and the storage of fat in a form that helps generate heat, a trait that could make all the difference in the frigid Arctic winter.

While the Inuit's fatty-acid processing gene variants seem to have evolved via the accumulation and selection of random mutations in human ancestors, the fat distribution gene variants have a different source. The region of the genome that contains these genes is remarkably similar in sequence to the DNA of an ancient human relative that lived alongside Neanderthals &mdash the Denisovans.

Denisovans are known only from a one finger bone and a couple of teeth found in a Siberian cave, but the DNA preserved in these 40,000 year old relics has revealed surprising insights about early human relatives. While we don't know what Denisovans looked like, we do know a fair amount about their sex lives. Denisovans interbred with Neanderthals, with another human relative whose physical remains have yet to be discovered, but whose DNA traces were found in the Denisovan genome, and with our human ancestors.

It is likely that the cold-tolerant genes shaping body fat distribution and the storage of heat-generating fat evolved through natural selection in Denisovans or a close relative of Denisovans (possibly because the chilly environments these lineages inhabited) and then wound up in ancestral humans through breeding. Denisovan evolution may have assembled the genes piecemeal, but it seems that ancient humans acquired them wholesale in an already adapted form. And as humans spread out across the planet they took these handy gene variants with them. In populations that settled in cold regions (like the ancestral Inuits), the gene variants were favored by natural selection and rose to high frequency. In populations inhabiting warmer climes, the gene variants remained rare.

With improvements in DNA technology and better techniques for recovering ancient DNA, we are discovering more genes in modern humans that came to us from our extinct relatives. The percent of human DNA that comes from ancient interbreeding events varies population by population: some modern human genomes contain up to 5% Denisovan DNA. And the gene versions contained in these bits of borrowed DNA do a variety of things. Some seem to be deleterious for us and were selected against, but others (like the Inuit fat-related genes) seem to have been helpful and allowed humans to thrive in the diverse environments we occupy today.


Humans and mice: So similar but yet so different

An international consortium including researchers from the Centre for Genome Regulation led by Roderic Guigó has presented an exhaustive description of the mouse's functional genome elements and their comparison with the human genome

Center for Genomic Regulation

AFBEELDING: This shows a comparison of Human Chromosome 1 and equivalent chromosomes in mice. Bekijk meer

Credit: Centre for Genomic Regulation (CRG)

This news release is available in Spanish.

A group of international researchers has just discovered the keys to explaining why certain processes and systems in mice, like the immune system, metabolism and stress response, are so different to those in humans. The scientists have detailed the functional parts of the mouse genome and have compared them with those in humans. A whole set of data has come out of this - which is now to available to the scientific community - which will be significant for research into mammalian biology as well as the study of human illness mechanisms.

The comparison focuses on the genetic and biochemical processes regulating genome activity in humans and mice. The scientists have found that, in general, the systems for controlling genome activity in the two species are very alike, and have been preserved through time. However, they have also detected certain differences in the DNA, and patterns of gene expression that are not shared. "Finding these similarities and studying the aspects of mouse biology that may reflect human biology, allows us to approach the study of human illnesses in a better way", affirms Bing Ren, one of the principal authors from the ENCODE Consortium and a lecturer in molecular and cellular medicine at the University of California - San Diego.

"The mouse is one of the most utilised models for studying human biology and we use it for creating models of human illnesses and testing new drugs and therapies. Our study goes a long way towards validating the usefulness of this animal model and provides enormous support for its use in human illnesses. We have found that there are many well-preserved cell processes in the two species, for example, in embryonic development. Understanding these similarities will allow us to carry out more accurate studies on human biology", explains Roderic Guigó, one of the main researchers involved in the work and coordinator of the Bioinformatics and Genomics programme at the CRG.

The researchers have compared various processes involved in gene expression, such as gene transcription and chromatin modification, and have repeated this in different tissues and cell types from both humans and mice. "Our lab took part in analysing the group of RNA or transcriptome, that results from transcription, the process by which the instructions in the genes are read. We have discovered that human and mice transcriptome contains both preserved and divergent elements. Surprisingly we have found that the differences seem bigger between species rather than between fabrics when initially we thought that the gene activity in the same kinds of tissues would be similar", adds Alessandra Breschi, one of the first co-authors of the main work published in Natuur and a researcher in Roderic Guigó's lab at the CRG.

The project makes it clear that there is a wide variety of options available for achieving gene expression. By comparing these two genomes they have also found that there is a common "language" that the cells use at the molecular level but which, at the same time, is tremendously flexible and has varied greatly throughout evolution. For example, if we used the analogy of electrical circuits, we would find cables, plugs, switches, etc. By combining the pieces in one way or another, we would obtain very different circuits (as happens between mice and humans) although the basic mechanisms governing the operation are based on the same methods and available resources.

An additional study, currently available at bioRxiv, led by the researchers from the CRG and Cold Spring Harbour Laboratory, highlights the fact that a substantial part of human and mice genes have maintained an essentially constant expression throughout evolution, in tissues and various organs. In addition, the researchers have quantified the preservation level of this gene expression between humans and mice. This allows the identification of those genes that have the same expression in the two species, and for which the mouse represents a good model of human biology.

"ENCODE is a living project and the maps that are generated are constantly updated and improved, with information being added on new types of cells and tissues or new complementary genome assays. We hope that the project can keep providing this data as it has up to now, making it available to everyone and treating it in a systematic and coherent way", concludes Dr. Guigó, the only principal investigator in Europe involved in this work.

The results of the comparison will be published on November 19 in four articles in the prestigious journal Natuur. As well as this, other scientific journals including Genoomonderzoek, Genoombiologie, PNAS, Bloed en Natuurcommunicatie are also bringing out related articles. The ENCODE Consortium, or ENCyclopedia of DNA Elements, is a research programme on the human genome funded by the US National Institutes of Health.

Vrijwaring: AAAS en EurekAlert! zijn niet verantwoordelijk voor de juistheid van persberichten die op EurekAlert! door bijdragende instellingen of voor het gebruik van informatie via het EurekAlert-systeem.


Now We Know Why Platypus Are So Weird - Their Genes Are Part Bird, Reptile, And Mammal

The first complete map of a platypus genome has just been released, and it's every bit as strange as you'd expect from a creature with 10 sex chromosomes, a pair of venomous spurs, a coat of fluorescent fur, and skin that 'sweats' milk.

The duck-billed platypus is truly one of the oddest creatures on Earth. Along with the spiky echidna, these two Australian animals belong to a highly-specialised group of mammals, known as monotremes, which both lay eggs but also nurse their young with milk.

The genes of both are relatively primitive and unchanged, revealing a bizarre blend of several vertebrate animal classes, including birds, reptiles, and mammals.

As different as the platypus might seem at first, it's those very differences that reveal our similarities and our shared ancestry with Earth's other vertebrates.

Scientists think its genome could tell us secrets about our own evolution and how our distant mammalian ancestors went from laying eggs to giving birth.

"The complete genome has provided us with the answers to how a few of the platypus' bizarre features emerged," explains evolutionary biologist Guojie Zhang from the University of Copenhagen.

"At the same time, decoding the genome for platypus is important for improving our understanding of how other mammals evolved - including us humans."

In previous years, a female platypus had some of its genome sequenced, but without any Y chromosome sequences, a lot of information was missing.

Using a male platypus, researchers have now created a physical map with a highly accurate platypus genome.

Today, living mammals are split into three groups, including monotremes, marsupials, and eutherians, or 'placentals'. We humans belong to that last group.

Together, the latter two make up a subclass known as therian mammals. Therian mammals all give birth to live young, but monotremes are simply too different to be lumped in with that group as well.

It's still unclear when all three of these distinct groups first began to diverge from one another. Some think the monotremes split off first, with marsupial and eutherians following suit. Others think all three groups diverged at roughly the same time.

The genome of the platypus has now helped clear up some of the dates. The data collected from echidna and platypus lineages suggests their last common ancestor lived up to 57 million years ago.

Meanwhile, monotremes as a whole appear to have diverged from marsupials and eutherian mammals about 187 million years ago.

Even after all that time, the semi-aquatic platypus has remained remarkably unchanged, fitting a niche in the Australian bush that many marsupials and mammals simply can't.

The authors were particularly interested in the animal's sex chromosomes, which appear to have originated independently from other therian mammals, all of which contain a simple XY pair.

The platypus, however, is the only known animal with 10 sex chromosomes (echidnas have nine). Platypus have 5X and 5Y chromosomes organised in a ring that appears to have broken apart into pieces over the course of mammalian evolution.

Comparing this chromosome information to humans, opossums, Tasmanian devils, chickens, and lizard genomes, the authors found the platypus's sex chromosomes have more in common with birds like chickens than mammals such as humans.

But while platypus lay eggs like chickens, they feed their young milk like therian mammals.

It's not too much of a surprise, therefore, that monotreme genomes contain most of the milk genes that other therian mammals possess.

Casein genes help encode certain proteins in mammalian milk, but monotremes appear to have extra caseins with unknown functions. That said, their milk is not unlike what comes from a cow, or even a lactating human.

As such, the platypus is probably not as dependent on egg proteins as other bird and reptile species because it can later feed their young through the lactation glands on its skin.

Its genome supports this. While birds and reptiles rely on three genes that encode for major egg proteins, the platypus appears to have lost the majority of these genes roughly 130 million years ago. Chickens today have all three egg protein genes, humans have none, and the platypus has only one fully functional copy left.

The platypus is a weird in-between, and its genome is a sort of bridge to our own evolutionary past.

"It informs us that milk production in all extant mammal species has been developed through the same set of genes derived from a common ancestor which lived more than 170 million years ago – alongside the early dinosaurs in the Jurassic period," Zhang says.

The full genome has also revealed the loss of four genes associated with tooth development, which probably disappeared roughly 120 million years ago. To eat, the platypus now uses a pair of horn-like plates to grind up its food.

The venomous spurs on its hind legs can possibly be explained by the creature's defensin genes, which are associated with the immune system in other mammals, and appear to give rise to unique proteins in their venom. Echidnas, which also had their full genomes sequenced, appear to have lost this key venom gene.

The authors say their results represent "some of the most fascinating biology of platypus and echidna" alike.

"The new genomes of both species will enable further insights into therian innovations and the biology and evolution of these extraordinary egg-laying mammals," they conclude.


When is a genome sequence done?

That question can be answered in more than one way. At present, GNN's analysis of the human genome indicates that there are about 2.91 billion base pairs in the euchromatic region of the genome. For purposes of scientific research, we can say that the genome sequence is 95 percent complete, even though certain portions of the genome—namely the centromeres and telomeres, which are the highly repetitive regions at the center and ends of chromosomes—are widely considered to be unsequenceable, at least with current technology.

But the sequence as it is now known is complete enough to be useful to scientists as a base for future research in finding genes and understanding how the human genome as a whole works.

The reasonableness of this approach is revealed by the scientists' experience with the genome of Caenorhabditis elegans, a small roundworm. The worm's genome of 97 million base pairs was pronounced done in late 1998, but scientists are still finding a few mistakes and holes in the sequence. Despite these minor imperfections, the sequence has already helped researchers learn more about the animal's biology—how it grows, develops, ages and dies, and goes about its daily life. And that, after all, is the point of genome sequencing.


Bekijk de video: Big Meech Fires Back at 50 Cent for being a Fake Drug Dealer Who Copied his Lifestyle to Produce BMF (Januari- 2022).