Informatie

6.9: Het menselijk genoom - biologie


Man van Vitruvius

De tekening in figuur (PageIndex{2}), genaamd Man van Vitruvius, werd in 1490 gemaakt door Leonardo da Vinci. Het was bedoeld om normale menselijke lichaamsverhoudingen weer te geven. Vitruvius Man wordt tegenwoordig gebruikt om een ​​andere benadering van het menselijk lichaam weer te geven. Het symboliseert een wetenschappelijk onderzoeksproject dat begon in 1990, precies 500 jaar nadat da Vinci de tekening maakte. Dat project, het Human Genome Project genaamd, is het grootste gezamenlijke biologische onderzoeksproject dat ooit is ondernomen.

Wat is het menselijk genoom?

De menselijk genoom verwijst naar al het DNA van de menselijke soort. Menselijk DNA bestaat uit 3,3 miljard basenparen en is verdeeld in meer dan 20.000 genen op 23 paar chromosomen. Het menselijke genoom omvat ook niet-coderende sequenties (bijv. intergene regio) van DNA, zoals weergegeven in figuur (PageIndex{2}).

Het menselijk genoom ontdekken

Wetenschappers kennen nu de volgorde van alle DNA-basenparen in het hele menselijke genoom. Deze kennis werd verkregen door de Menselijk Genoom Project (HGP), een internationaal wetenschappelijk onderzoeksproject van $ 3 miljard dat formeel werd gelanceerd in 1990. Het project werd voltooid in 2003, twee jaar eerder dan de geplande deadline van 15 jaar.

Het bepalen van de volgorde van de miljarden basenparen waaruit het menselijk DNA bestaat, was het hoofddoel van het HGP. Een ander doel was het in kaart brengen van de locatie en het bepalen van de functie van alle genen in het menselijk genoom. Er zijn slechts ongeveer 20.500 genen in de mens.

Een gezamenlijke inspanning

Financiering voor de HGP kwam van het Amerikaanse ministerie van Energie en de National Institutes of Health, evenals van buitenlandse instellingen. Het eigenlijke onderzoek is uitgevoerd door wetenschappers van 20 universiteiten in de VS, het Verenigd Koninkrijk, Australië, Frankrijk, Duitsland, Japan en China. Een particulier Amerikaans bedrijf genaamd Celera droeg ook bij aan de inspanning. Hoewel Celera had gehoopt een aantal van de ontdekte genen te patenteren, werd dit later ontkend.

Referentiegenoom van het menselijk genoomproject

In 2003 publiceerde de HGP de resultaten van de sequentiebepaling van DNA als een menselijk referentiegenoom. Figuur (PageIndex{4}) illustreert het proces van DNA-sequencing. De details van deze afbeelding vallen buiten het bestek van dit concept en boek. De volgorde van het menselijk DNA wordt opgeslagen in databases die voor iedereen op internet beschikbaar zijn. Het Amerikaanse National Center for Biotechnology Information (NCBI), onderdeel van de NIH, evenals vergelijkbare organisaties in Europa en Japan, houden de genomische sequenties bij in een database die bekend staat als Genbank. Eiwitsequenties worden ook bijgehouden in deze database. De sequenties in deze databases zijn de gecombineerde sequenties van anonieme donoren en gaan als zodanig nog niet in op de individuele verschillen die ons uniek maken. De bekende volgorde legt echter wel de basis om de unieke verschillen tussen ons allemaal te identificeren. De meeste van de momenteel geïdentificeerde variaties tussen individuen zullen enkelvoudige nucleotide polymorfismen of SNP's zijn. Een SNP (uitgesproken als "snip") is een variatie in de DNA-sequentie die voorkomt op een enkel nucleotide in het genoom. Twee DNA-fragmenten waarvan de sequentie is bepaald van verschillende individuen, GGATCTA tot GGATTTA, bevatten bijvoorbeeld een verschil in een enkele nucleotide. Als er een baseverandering optreedt in een gen, dan resulteert de baseverandering in twee allelen: het C-allel en het T-allel. Onthoud dat een allel een alternatieve vorm van een gen is. Bijna alle veel voorkomende SNP's hebben slechts twee allelen. Het effect van deze SNP's op de eiwitstructuur en -functie en elk effect op het resulterende fenotype is een uitgebreid onderzoeksgebied.

Voordelen van het Human Genome Project

De sequentiebepaling van het menselijk genoom biedt voordelen voor vele gebieden, waaronder moleculaire geneeskunde en menselijke evolutie.

  • Het kennen van de menselijke DNA-sequentie kan ons helpen veel menselijke ziekten te begrijpen. Het helpt onderzoekers bijvoorbeeld bij het identificeren van mutaties die verband houden met verschillende vormen van kanker. Het levert ook inzichten op in de genetische basis van onder meer taaislijmziekte, leverziekten, bloedstollingsstoornissen en de ziekte van Alzheimer.
  • De menselijke DNA-sequentie kan onderzoekers ook helpen medicijnen af ​​te stemmen op individuele genotypen. Dit wordt gepersonaliseerde geneeskunde genoemd en heeft geleid tot een geheel nieuw veld dat farmacogenomica wordt genoemd. farmacogenomica, ook wel farmacogenetica genoemd, is de studie van hoe onze genen de manier waarop we reageren op medicijnen beïnvloeden. U kunt meer lezen over farmacogenomica in de functie hieronder.
  • De analyse van overeenkomsten tussen DNA-sequenties van verschillende organismen opent nieuwe wegen in de studie van evolutie. Er wordt bijvoorbeeld verwacht dat analyses licht zullen werpen op veel vragen over de overeenkomsten en verschillen tussen mensen en onze naaste verwanten, de niet-menselijke primaten.

Ethische, juridische en sociale kwesties van het menselijk genoomproject

Vanaf de lancering in 1990 heeft de HGP proactief een aparte commissie opgericht en gefinancierd om toezicht te houden op mogelijke ethische, juridische en sociale kwesties die verband houden met het project. Een belangrijk punt van zorg was het mogelijke gebruik van de door het project gegenereerde kennis om mensen te discrimineren. Een probleem was de angst dat werkgevers en zorgverzekeraars zouden weigeren mensen in dienst te nemen of te verzekeren op basis van hun genetische samenstelling, bijvoorbeeld als ze genen zouden hebben die hun risico op het krijgen van bepaalde ziekten vergroten. Als reactie hierop hebben de VS in 1996 de Health Insurance Portability and Accountability Act (HIPAA) aangenomen. Het beschermt tegen ongeoorloofde, niet-consensuele vrijgave van individueel identificeerbare gezondheidsinformatie aan een entiteit die niet actief betrokken is bij het verlenen van gezondheidszorg aan een patiënt. Dit werd in 2008 gevolgd door de Genetic Information Nondiscrimination Act (GINA), die genetische discriminatie door zorgverzekeraars en werkplekken specifiek verbiedt.

Beoordeling

  1. Beschrijf het menselijk genoom.
  2. Wat is het Human Genome Project?
  3. Identificeer twee hoofddoelen van het Human Genome Project.
  4. Wat is het referentiegenoom van het Human Genome Project? Waar is het op gebaseerd?
  5. Leg uit hoe het kennen van de sequentie van DNA-basen in het menselijk genoom gunstig is voor de moleculaire geneeskunde.
  6. Wat was een verrassende bevinding van het Human Genome Project?
  7. Waarom denk je dat wetenschappers niet alleen het DNA van een enkele persoon hebben gesequenced voor het Human Genome Project? In die zin, waarom denk je dat het belangrijk is om monsters van verschillende etnische groepen en geslachten op te nemen in pogingen tot genoomsequencing?
  8. Waar of niet waar. Het menselijke genoom waarvan de sequentie is bepaald, bevat geen niet-coderende regio's - het bevat alleen echte genen.
  9. Waar of niet waar. Het kennen van de volgorde van het menselijk genoom kan inzicht geven in de menselijke evolutie.
  10. Wat is farmacogenomica?
    1. Als een patiënt farmacogenomica zou laten doen om zijn medicatie te optimaliseren, wat zou dan volgens u de eerste stap zijn?
    2. Noem een ​​voordeel en een nadeel van farmacogenomica.
  11. Er zijn ongeveer 20.000 mensen
    1. basenparen
    2. nucleotiden
    3. allelen
    4. genen
  12. Leg uit hoe de sequentiebepaling van het menselijk genoom zich verhoudt tot ethische zorgen over genetische discriminatie.

Meer ontdekken

Jarenlang hebben wetenschappers de uitdaging gehad om het menselijk genoom te sequencen. Lees hier meer over het menselijk genoomproject:


Het menselijk genoomproject

Het Human Genome Project (HGP) was een van de grote ontdekkingen in de geschiedenis. In plaats van een uiterlijke verkenning van de planeet of de kosmos, was de HGP een innerlijke ontdekkingsreis onder leiding van een internationaal team van onderzoekers die alle genen - samen bekend als het genoom - van leden van onze soort in kaart wilden brengen en in kaart wilden brengen. , Homo sapiens. De HGP, die begon op 1 oktober 1990 en werd voltooid in april 2003, gaf ons voor het eerst de mogelijkheid om de volledige genetische blauwdruk van de natuur te lezen voor het bouwen van een mens.

Het Human Genome Project was de internationale onderzoeksinspanning om de DNA-sequentie van het gehele menselijke genoom te bepalen.

In 2003 werd een nauwkeurige en volledige sequentie van het menselijk genoom voltooid, twee jaar eerder dan gepland en tegen lagere kosten dan het oorspronkelijk geschatte budget.

Sleutelmomenten en persberichten uit de geschiedenis van het Human Genome Project.

15 februari 2021 markeert het 20-jarig jubileum van publicaties die de concept-sequentie van het menselijk genoom rapporteren.

Videogetuigenissen van prominente leden van de genomics-gemeenschap ter herdenking en viering van de 30e verjaardag van de lancering van het Human Genome Project.

Ontdek veelgestelde vragen en antwoorden over het Human Genome Project en de impact ervan op het gebied van genomics.


Genoomgrafieken en de evolutie van genoominferentie

Het menselijke referentiegenoom maakt deel uit van de basis van de moderne menselijke biologie en is een monumentale wetenschappelijke prestatie. Omdat het echter een groot deel van de algemene menselijke variatie uitsluit, introduceert het een doordringende referentiebias op het gebied van menselijke genomica. Om deze vertekening te verminderen, is het zinvol om gebruik te maken van representatieve verzamelingen van menselijke genomen, samengebracht in referentiecohorten. Er zijn een aantal technieken om gegevens uit deze cohorten weer te geven en te ordenen, waarbij veel ideeën impliciet of expliciet zijn ontleend aan op grafieken gebaseerde modellen. Hier onderzoeken we verschillende lopende projecten om deze op grafieken gebaseerde structuren te bouwen en toe te passen - die we gezamenlijk genoomgrafieken noemen - en bespreken we de verbeteringen in leestoewijzing, variantaanroep en haplotypebepaling die genoomgrafieken naar verwachting zullen produceren.

© 2017 Paten et al. Gepubliceerd door Cold Spring Harbor Laboratory Press.

Figuren

Schematische weergave van twee populatieniveau…

Schematische weergave van twee referentiestructuren op populatieniveau. ( EEN ) Een referentiecohort,...

Vier soorten genoomgrafieken,...

Vier soorten genoomgrafieken, allemaal opgebouwd uit het paar sequenties ATCCCCTA...

Ultrabubble-sites in een biedged...

Ultrabubble-sites in een sequentiegrafiek met biedingen. Elke pijl toont het eindknooppunt...

Een pangenoom bestellen op een…

Een pangenoomordening op een grafiek opgebouwd uit twee genomen. De rode randen…

Een schematisch voorbeeld van een…

Een schematisch voorbeeld van een "Array Sequence Graph" van het type dat wordt gebruikt om...

Een hiërarchie van een referentie-genoomgrafiek...

Een hiërarchie van een referentie-genoomgrafiek (meest samengevouwen grafiek aan de bovenkant , minder…

Verschillende haplotypes van het 1000-genoomproject ...

Distinct 1000 Genomes Project haplotypes ingebed in een variatie-subgraaf. Haplotypes worden getoond...

Bidirectionele reeksgrafiek ( EEN…

Bidirectionele reeksgrafiek ( EEN ) wordt ontvouwd in een gerichte acyclische grafiek ...


Mutaties

Mensen en chimpansees stammen af ​​van een gemeenschappelijke voorouder en wetenschappers denken dat ze zo'n zes miljoen jaar geleden uiteenliepen.

Gezien deze relatief korte tijd sinds de splitsing, is het waarschijnlijk dat een paar belangrijke mutaties verantwoordelijk zijn voor de verschillen tussen de twee soorten, volgens Wen-Hsiung Li, een moleculair evolutionist aan de Universiteit van Chicago in Illinois.

"Als je meer dan 10 miljoen jaar naar twee soorten kikkers kijkt, zul je waarschijnlijk niet veel van de morfologische of gedragsverschillen zien die je ziet tussen mensen en chimpansees", zei Li, die een begeleidend commentaar schreef over de chimpansee-genoomsequencing voor Natuur.

Er zijn verschillende hypothesen die de evolutie van menselijke eigenschappen verklaren. Li gelooft dat deze eigenschappen voortkomen uit veranderingen in de delen van het genoom die andere genactiviteit reguleren.

Wetenschappers zijn het erover eens dat veel vragen onbeantwoord blijven, maar het genoom van de chimpansee biedt belangrijke aanwijzingen om te begrijpen wat ons menselijk maakt.

"We bevinden ons in een heel mooi tussenstadium van het begrijpen van de verschillen tussen mens en chimpansee", zei Eichler. "We kunnen niet zeggen: dit is het verschil dat ons mens maakt, maar we kunnen wel zeggen: dit zijn de regio's van het genoom die veel potentieel hebben en uitstekende kandidaten zijn om verder aan te werken."


Dankbetuigingen

Wij danken het laboratoriumteam van het Max Planck Institute for the Science of Human History in Jena, M. Rivollat ​​en K. Nägele voor het voorbereiden van de genetische bibliotheek V. Kuželka, J. Dašková en T. Přikryl voor het voorbereiden van antropologische en geologische achtergrondinformatie en M. O'Reilly voor ondersteuning bij grafisch ontwerp. Dit werk werd gefinancierd door de Max Planck Society. E. en TD worden ondersteund door ERC-subsidie ​​324139 (PalaeoChron) en de Natural Environment Research Council. PV wordt ondersteund door het Ministerie van Cultuur van de Tsjechische Republiek (DKRVO 2019-2023/7.I.c, 00023272).


Referenties

Morton, N.E. Parameters van het menselijk genoom. Proc. Natl Acad. Wetenschap. VS 88, 7474–7476 (1991).

Het chromosoom 21 mapping en sequencing consortium. De DNA-sequentie van menselijk chromosoom 21. Natuur 405, 311–319 (2000).

Dunham, I. et al. De DNA-sequentie van menselijk chromosoom 22. Natuur 402, 489–495 (1999).

Tilford, C.A. et al. Een fysieke kaart van het menselijke Y-chromosoom. Natuur 409, 943–945 (2001).

Montgomery, K. T. Een kaart met hoge resolutie van menselijk chromosoom 12. Natuur 409, 945–946 (2001).

Bruls, T. et al. Een fysieke kaart van menselijk chromosoom 14. Natuur 409, 947–948 (2001).

Het International Human Genome Mapping Consortium. Een fysieke kaart van het menselijk genoom. Natuur 409, 934–941 (2001).

Internationaal Human Genome Sequencing Consortium. Initiële sequencing en analyse van het menselijk genoom. Natuur 409, 860–921 (2001).

Deloukas, P. et al. Een fysieke kaart van 30.000 menselijke genen. Wetenschap 282, 744–746 (1998).

Riethman, H.C. et al. Integratie van telomeersequenties met de conceptsequentie van het menselijke genoom. Natuur 409, 948–951 (2001).

Jackson, M.S., See, C.G., Mulligan, L.M. & Lauffart, B.F. Een 9,75-Mb-kaart over het centromeer van menselijk chromosoom 10. genomica 33, 258–270 (1996).


Nieuwe menselijke genetica wakkert het debat aan

Een van de vroegste pogingen om het aantal genen in het menselijk genoom te schatten, betrof aangeschoten genetici, een bar in Cold Spring Harbor, New York, en puur giswerk.

Dat was in 2000, toen een ontwerp van een menselijke genoomsequentie nog in de maak was, genetici hielden een loting over hoeveel genen mensen hebben, en de weddenschappen varieerden van tienduizenden tot honderdduizenden. Bijna twee decennia later zijn wetenschappers gewapend met echte gegevens het nog steeds niet eens over het aantal - een kennislacune die volgens hen de inspanningen om ziektegerelateerde mutaties op te sporen belemmert.

De laatste poging om dat gat te dichten maakt gebruik van gegevens van honderden menselijke weefselmonsters en werd op 29 mei op de BioRxiv preprint-server geplaatst. Het bevat bijna 5.000 genen die nog niet eerder zijn opgemerkt - waaronder bijna 1.200 die instructies bevatten voor het maken van eiwitten. En het totale aantal van meer dan 21.000 eiwitcoderende genen is een aanzienlijke sprong ten opzichte van eerdere schattingen, die het cijfer op ongeveer 20.000 brachten.

Maar veel genetici zijn er nog niet van overtuigd dat alle nieuw voorgestelde genen een nauwkeurig onderzoek zullen doorstaan. Hun kritiek onderstreept hoe moeilijk het is om nieuwe genen te identificeren, of zelfs te definiëren wat een gen is.

"Mensen hebben hier 20 jaar hard aan gewerkt en we hebben nog steeds geen antwoord", zegt Steven Salzberg, een computerbioloog aan de Johns Hopkins University in Baltimore, Maryland, wiens team de laatste telling produceerde.

In 2000, toen de genomics-gemeenschap gonsde over de vraag hoeveel menselijke genen er zouden worden gevonden, lanceerde Ewan Birney de GeneSweep-wedstrijd. Birney, nu mededirecteur van het European Bioinformatics Institute (EBI) in Hinxton, VK, nam de eerste weddenschappen aan in een bar tijdens een jaarlijkse genetica-bijeenkomst, en de wedstrijd trok uiteindelijk meer dan 1.000 inzendingen en een jackpot van US $ 3.000. De weddenschappen op het aantal genen varieerden van meer dan 312.000 tot net onder de 26.000, met een gemiddelde van rond de 40.000. Tegenwoordig is het aantal schattingen geslonken - met de meeste nu tussen 19.000 en 22.000 - maar er is nog steeds onenigheid (zie 'Gene Tally').

Bron: M. Pertea & S.L. Salzberg

Het aantal genen kan variëren, afhankelijk van de gegevens die worden geanalyseerd, de gebruikte hulpmiddelen en de criteria voor het verwijderen van valse positieven. De laatste telling gebruikte een grotere dataset en verschillende rekenmethoden van eerdere inspanningen, evenals bredere criteria voor het definiëren van een gen.

Het team van Salzberg gebruikte gegevens van het Genotype-Tissue Expression (GTEx) -project, dat de sequentie van RNA van meer dan 30 verschillende weefsels van enkele honderden kadavers heeft bepaald. RNA is de intermediair tussen DNA en eiwitten. De onderzoekers wilden genen identificeren die coderen voor een eiwit en genen die dat niet doen, maar nog steeds een belangrijke rol spelen in cellen. Dus verzamelden ze de 900 miljard kleine RNA-fragmenten van GTEx en brachten ze in lijn met het menselijk genoom.

Alleen omdat een stuk DNA wordt uitgedrukt als RNA, betekent dit niet noodzakelijk dat het een gen is. Dus probeerde het team ruis uit te filteren met behulp van verschillende criteria. Ze vergeleken hun resultaten bijvoorbeeld met genomen van andere soorten, redenerend dat sequenties die worden gedeeld door verre verwante wezens waarschijnlijk door evolutie zijn bewaard gebleven omdat ze een nuttig doel dienen, en dus waarschijnlijk genen zijn.

Het team bleef achter met 21.306 eiwitcoderende genen en 21.856 niet-coderende genen - veel meer dan zijn opgenomen in de twee meest gebruikte databases van menselijke genen. De GENCODE-genenset, die wordt onderhouden door de EBI, omvat 19.901 eiwitcoderende genen en 15.779 niet-coderende genen. RefSeq, een database die wordt beheerd door het Amerikaanse National Center for Biotechnology Information (NCBI), bevat 20.203 eiwitcoderende genen en 17.871 niet-coderende genen.

Kim Pruitt, een genoomonderzoeker bij de NCBI in Bethesda, Maryland, en voormalig hoofd van RefSeq, zegt dat het verschil waarschijnlijk gedeeltelijk te wijten is aan de hoeveelheid gegevens die het team van Salzberg heeft geanalyseerd. En er is nog een groot verschil. Zowel GENCODE als RefSeq vertrouwen op handmatige curatie - een persoon beoordeelt het bewijs voor elk gen en neemt een definitieve beslissing. De groep van Salzberg vertrouwde uitsluitend op computerprogramma's om de gegevens te filteren.

"Als mensen onze genenlijst leuk vinden, zullen we over een paar jaar misschien de scheidsrechter zijn van menselijke genen", zegt Salzberg.

Maar veel wetenschappers zeggen dat ze meer bewijs nodig hebben om ervan overtuigd te zijn dat de lijst klopt. Adam Frankish, een computationeel bioloog bij de EBI die de handmatige annotatie van GENCODE coördineert, zegt dat hij en zijn groep ongeveer 100 van de eiwitcoderende genen hebben gescand die door het team van Salzberg zijn geïdentificeerd. Volgens hun beoordeling lijkt slechts één daarvan een echt eiwitcoderend gen te zijn.

En het team van Pruitt keek naar ongeveer een dozijn van de nieuwe eiwitcoderende genen van de Salzberg-groep, maar vond er geen die aan de criteria van RefSeq voldeed. Sommige overlapten met regio's van het genoom die lijken te behoren tot retrovirussen die de genomen van onze voorouders zijn binnengedrongen, andere behoren tot andere repetitieve stukken, die zelden worden vertaald in eiwitten.

Maar Salzberg zegt dat sommige repetitieve sequenties als genen kunnen worden beschouwd. Een voorbeeld is: ERV3-1, dat voorkomt in RefSeq en codeert voor een eiwit dat tot overexpressie wordt gebracht bij colorectale kanker. Salzberg erkent ook dat de nieuwe genen op de lijst van zijn team moeten worden gevalideerd door zijn team en anderen.

Verdere verwarrende telinspanningen zijn de onnauwkeurige en veranderende definitie van een gen. Biologen zagen genen vroeger als sequenties die coderen voor eiwitten, maar toen werd duidelijk dat sommige niet-coderende RNA-moleculen een belangrijke rol spelen in cellen. Het beoordelen van welke belangrijk zijn - en als genen moeten worden beschouwd - is controversieel en zou enkele van de discrepanties tussen de telling van Salzberg en andere kunnen verklaren.

Toch is het waarschijnlijk dat ten minste enkele van de genen die door de groep van Salzberg zijn geïdentificeerd, geldig zullen blijken te zijn, zegt Emmanouil Dermitzakis, een geneticus aan de Universiteit van Genève in Zwitserland, die medevoorzitter is van het GTEx-project. Het verbaast hem niet dat de telling van het team voor eiwitcoderende genen 5% meer is dan eerdere resultaten, gezien de gigantische omvang van de GTEx-dataset.

Het hebben van een nauwkeurige telling van alle menselijke genen is belangrijk voor pogingen om verbanden tussen genen en ziekte te ontdekken. Ontelbare genen worden vaak genegeerd, zelfs als ze een ziekteverwekkende mutatie bevatten, zegt Salzberg. Maar het haastig toevoegen van genen aan de hoofdlijst kan ook risico's opleveren, zegt Frankish. Een gen dat onjuist blijkt te zijn, kan de aandacht van genetici afleiden van het echte probleem.

Toch zijn de inconsistenties in het aantal genen van database naar database problematisch voor onderzoekers, zegt Pruitt. "Mensen willen één antwoord", voegt ze eraan toe, "maar biologie is complex."


Tien jaar oude genoomanalyse heeft wetenschappers geleerd 'wat het betekent om mens te zijn'

Wijlen Jim Boyd van de Confederated Tribes of the Colville sprak op de persconferentie in 2015 en kondigde de resultaten aan van de DNA-analyse van Kennewick Man, the Ancient One. Krediet: Linus Mørk/Magus Film

Een bal van 4000 jaar oud haar, bevroren in de tijd, verward rond een baleinkam, leidde tot de allereerste reconstructie van een oud menselijk genoom, iets meer dan tien jaar geleden.

Het haar, dat werd bewaard in arctische permafrost in Groenland, werd in de jaren tachtig verzameld en opgeslagen in een museum in Denemarken. Pas in 2010 kon evolutionair bioloog professor Eske Willerslev baanbrekende shotgun-DNA-sequencing gebruiken om de genetische geschiedenis van het haar te reconstrueren.

Hij ontdekte dat het afkomstig was van een man van de vroegst bekende mensen die zich in Groenland vestigden, bekend als de Saqqaq-cultuur. Het was de eerste keer dat wetenschappers een heel oud menselijk genoom hadden teruggevonden.

Nu is een recensie van het eerste decennium van oude genomica van de Amerika's gepubliceerd in Natuur vandaag geschreven door professor Willerslev, een fellow van St John's College, University of Cambridge, en directeur van The Lundbeck Foundation GeoGenetics Centre, University of Copenhagen, met een van zijn jarenlange medewerkers professor David Meltzer, een archeoloog gevestigd aan de Southern Methodist University, Texas, toont hoe 's werelds eerste analyse van een oud genoom leidde tot een ongelooflijk 'decennium van ontdekking'.

Professor Willerslev zei: "De afgelopen tien jaar waren vol verrassingen in het begrip van de bevolking van Amerika - ik voel me vaak als een kind met Kerstmis dat wacht om te zien welk opwindend DNA-cadeau ik ga uitpakken! geest is hoe veerkrachtig en capabel de vroege mensen waren waarvan we de DNA-sequentie hebben bepaald - ze bezetten extreem verschillende omgevingen en bevolkten ze vaak in een korte tijd.

"We hebben op school geleerd dat mensen zouden blijven zitten totdat de bevolking groeide tot een niveau waarop de hulpbronnen waren uitgeput. Maar we ontdekten dat mensen zich over de hele wereld verspreidden om te verkennen, te ontdekken en avonturen te beleven.

"De afgelopen 10 jaar hebben ons veel laten zien over onze geschiedenis en wat het betekent om mens te zijn. We zullen nooit meer die diepte van menselijke ervaring op deze planeet zien - mensen gingen nieuwe gebieden binnen zonder absoluut geen idee te hebben van wat er aan de hand was van hen. Het vertelt ons veel over het menselijk aanpassingsvermogen en hoe mensen zich gedragen."

Decennialang vertrouwden wetenschappers op archeologische vondsten om het verleden te reconstrueren en theorieën waren niet altijd juist. Eerder werd gedacht dat er vroege niet-inheemse Amerikanen in Amerika waren, maar de oude DNA-analyse tot nu toe heeft aangetoond dat alle gevonden oude overblijfselen nauwer verwant zijn aan hedendaagse inheemse Amerikanen dan aan enige andere populatie ergens anders in de wereld.

Een bal van 4000 jaar oud haar, bevroren in de tijd, verward rond een baleinkam, leidde tot de allereerste reconstructie van een oud menselijk genoom, iets meer dan tien jaar geleden. Het haar, dat werd bewaard in arctische permafrost in Groenland, werd in de jaren tachtig verzameld en opgeslagen in een museum in Denemarken. Pas in 2010 kon evolutionair bioloog professor Eske Willerslev baanbrekende shotgun-DNA-sequencing gebruiken om de genetische geschiedenis van het haar te reconstrueren. Hij ontdekte dat het afkomstig was van een man van de vroegst bekende mensen die zich in Groenland vestigden, bekend als de Saqqaq-cultuur. Het was de eerste keer dat wetenschappers een heel oud menselijk genoom hadden teruggevonden. Nu is een recensie van het eerste decennium van oude genomica van de Amerika's gepubliceerd in Natuur vandaag (16 juni 2021) geschreven door professor Willerslev, een fellow van St John's College, University of Cambridge, en directeur van The Lundbeck Foundation GeoGenetics Centre, University of Copenhagen, met een van zijn jarenlange medewerkers professor David Meltzer, een archeoloog gevestigd in Southern Methodist University, Texas, laat zien hoe 's werelds eerste analyse van een oud genoom leidde tot een ongelooflijk 'decennium van ontdekking'. Krediet: St John's College, Universiteit van Cambridge

Professor Meltzer, die samen met professor Willerslev aan de recensie werkte terwijl de eerste als Beaufort Visiting Scholar aan het St John's College werkte, voegde toe: "Genomisch bewijs heeft verbanden aangetoond waarvan we niet wisten dat ze bestonden tussen verschillende culturen en waarvan we dachten dat die bestond. De geschiedenis van de menselijke bevolking was veel complexer dan eerder werd gedacht.

"Veel van wat er is ontdekt over de bevolking van Amerika kon niet worden voorspeld. We hebben gezien hoe snel mensen zich over de wereld bewogen terwijl ze een continent voor zichzelf hadden, er was niets dat hen tegenhield. Er was een selectief voordeel om te zien wat er over de volgende heuvel was."

In 2013 brachten wetenschappers het genoom in kaart van een vierjarige jongen die 24.000 jaar geleden stierf in Zuid-Centraal Siberië. De begrafenis van een Boven-paleolithisch Siberisch kind werd in de jaren 1920 ontdekt door Russische archeologen in de buurt van het dorp Mal'ta, langs de rivier de Belaya. Sequentiebepaling van het Mal'ta-genoom was de sleutel omdat het het bestaan ​​​​aantoonde van een voorheen niet-bemonsterde populatie die bijdroeg aan de voorouders van Siberische en Indiaanse populaties.

Twee jaar later publiceerden professor Willerslev en zijn team het eerste oude inheemse Amerikaanse genoom, gesequenced uit de overblijfselen van een jongetje dat meer dan 12.000 jaar geleden ceremonieel werd begraven in Anzick, Montana.

In 2015 was hun oude genomische analyse in staat om het mysterie van Kennewick Man op te lossen, een van de oudste en meest complete skeletten die ooit in Amerika zijn gevonden, en een van de meest controversiële.

De 9.000 jaar oude overblijfselen waren omgeven door een storm van controverse toen juridische jurisdictie over het skelet het middelpunt werd van een decennium van rechtszaken tussen vijf Indiaanse stammen, die het eigendom claimden van de man die ze Ancient One noemden, en de Verenigde Staten Legerkorps van ingenieurs.

Professor Willerslev, die terecht heeft geleerd rekening te houden met culturele gevoeligheden bij het zoeken naar oud DNA, heeft het afgelopen decennium veel met leden van de stamgemeenschap gesproken om zijn werk in detail uit te leggen en hun steun te zoeken.

Dit betekende dat hij het eens kon worden met leden van de Colville-stam, gevestigd in de staat Washington waar de overblijfselen werden gevonden, dat ze een deel van hun DNA zouden doneren zodat professor Willerslev en zijn team konden vaststellen of er een genetische link was tussen hen en Kennewick Man.

Professor Eske Willerslev met Donna en Joey, twee leden van de Fallon Paiute-Shoshone-stam, bespreken de Spirit Cave-individu. Credit: Linus Mørk/Magus Film.

Jackie Cook, een afstammeling van de Colville-stam en de repatriëringsspecialist van de Confederated Tribes van het Colville-reservaat, zei: "We hadden bijna 20 jaar geprobeerd om de Ancient One naar ons te laten repatriëren. Er is een lange geschiedenis van wantrouwen tussen wetenschappers en onze Indiaanse stammen, maar toen Eske ons vertelde over zijn DNA-werk op het Anzick-kind, stonden de haren op mijn armen overeind.

"We wisten dat we niet zouden moeten instemmen met DNA-testen, en er waren zorgen dat we het elke keer zouden moeten doen om culturele verwantschap te bewijzen, maar onze raadsleden bespraken het met de ouderlingen en er werd overeengekomen dat elk stamlid dat DNA wilde leveren voor de studie kon."

Het Kennewick Man-genoom onthulde, net als de Anzick-baby, dat de man een directe voorouder was van levende indianen. De Ancient One werd naar behoren teruggegeven aan de stammen en herbegraven.

Cook voegde toe: "We hebben een risico genomen, maar het is gelukt. Het was opmerkelijk om met Eske samen te werken en we voelden ons vereerd, opgelucht en nederig om zo'n belangrijke zaak op te lossen. We hadden mondelinge verhalen die van generatie op generatie zijn doorgegeven. duizenden jaren die we coyote-verhalen noemen - leerzame verhalen. Deze verhalen waren van onze voorouders over het leven naast wolharige mammoeten en het getuige zijn van een reeks overstromingen en vulkanen die uitbarsten. Als stam hebben we de wetenschap altijd omarmd, maar niet alle geschiedenis wordt ontdekt door middel van wetenschap ."

Werk onder leiding van professor Willerslev was ook in staat om de oorsprong te identificeren van 's werelds oudste natuurlijke mummie, de Spirit Cave. Wetenschappers ontdekten het oude menselijke skelet al in 1940, maar pas in 2018 werd een opvallende ontdekking gedaan die de geheimen van de Ice Age-stam in Amerika ontsloot.

De onthulling kwam als onderdeel van een onderzoek dat genetisch het DNA analyseerde van een reeks beroemde en controversiële oude overblijfselen in Noord- en Zuid-Amerika, waaronder Spirit Cave, de Lovelock-skeletten, de Lagoa Santa-resten, een Inca-mummie en de oudste overblijfselen in Chileense Patagonië.

Wetenschappers hebben de sequentie van 15 oude genomen van Alaska tot Patagonië gesequenced en waren in staat om de bewegingen van de eerste mensen te volgen terwijl ze zich tijdens de ijstijd met 'verbazingwekkende' snelheid over Amerika verspreidden, en ook hoe ze in de volgende millennia met elkaar omgingen.

Het team van academici ontdekte niet alleen dat de overblijfselen van de Spirit Cave een Indiaan waren, maar ze waren ook in staat om een ​​al lang bestaande theorie te verwerpen dat een groep genaamd Paleo-Amerikanen in Noord-Amerika bestond vóór de Native Americans. Spirit Cave werd teruggegeven aan The Fallon Paiute-Shoshone Tribe, een groep indianen gevestigd in Nevada, voor begrafenis.

Professor Willerslev voegde toe: "In het afgelopen decennium is de menselijke geschiedenis fundamenteel veranderd dankzij oude genomische analyse - en de ongelooflijke bevindingen zijn nog maar net begonnen."


Overzicht

De kostenberekeningsgegevens die hier worden gepresenteerd, zijn samengevat met betrekking tot twee statistieken: (1) "Kosten per megabase van DNA-sequentie" - de kosten van het bepalen van één megabase (Mb per miljoen basen) DNA-sequentie van een gespecificeerde kwaliteit [zie hieronder] ( 2) "Kosten per genoom" - de kosten van het sequencen van een genoom van menselijke grootte. Voor elk wordt een grafiek weergegeven met de gegevens sinds 2001. Daarnaast worden de werkelijke aantallen weergegeven door de grafieken weergegeven in een samenvattende tabel.

NHGRI nodigt mensen uit om deze grafieken te downloaden en te gebruiken in hun presentaties en lesmateriaal. NHGRI is van plan deze gegevens regelmatig te actualiseren. U kunt de gegevens in Excel inzien door de Volgordekosten 2020 te downloaden.

Om de aard van de verlagingen in de kosten van DNA-sequencing te illustreren, toont elke grafiek ook hypothetische gegevens die de wet van Moore weerspiegelen, die een langetermijntrend in de computerhardware-industrie beschrijft die de verdubbeling van de 'rekenkracht' elke twee jaar inhoudt (zie: Moore's wet [wikipedia.org]). Technologieverbeteringen die de Wet van Moore 'bijbenen' worden algemeen beschouwd als buitengewoon goed, waardoor ze nuttig zijn ter vergelijking.

Merk in beide grafieken op: (1) het gebruik van een logaritmische schaal op de Y-as en (2) de plotselinge en diepe overschrijding van de wet van Moore vanaf januari 2008. De laatste vertegenwoordigt de tijd waarop de sequencing-centra overgingen van Sanger- gebaseerde (dideoxyketenterminatie-sequencing) tot 'tweede generatie' (of 'next-generation') DNA-sequencingtechnologieën. Hieronder vindt u meer informatie over deze grafieken.

Deze gegevens omvatten echter niet alle kosten die gepaard gaan met het NHGRI Large-Scale Genome Sequencing Program. De sequentiëringscentra voeren een aantal aanvullende activiteiten uit waarvan de kosten niet geschikt zijn om mee te rekenen bij de berekening van de kosten voor productiegerichte DNA-sequencing. In other words, NHGRI makes a distinction between 'production' activities and 'non-production' activities. Production activities are essential to the routine generation of large amounts of quality DNA sequence data that are made available in public databases the costs associated with production DNA sequencing are summarized here and depicted on the two graphs. Additional information about the other activities performed by the sequencing centers is provided below.

The cost-accounting data presented here are summarized relative to two metrics: (1) "Cost per Megabase of DNA Sequence" - the cost of determining one megabase (Mb a million bases) of DNA sequence of a specified quality [see below] (2) "Cost per Genome" - the cost of sequencing a human-sized genome. For each, a graph is provided showing the data since 2001 in addition, the actual numbers reflected by the graphs are provided in a summary table.

NHGRI welcomes people to download these graphs and use them in their presentations and teaching materials. NHGRI plans to update these data on a regular basis. You can view the data in in Excel by downloading the Sequencing Costs 2020.

To illustrate the nature of the reductions in DNA sequencing costs, each graph also shows hypothetical data reflecting Moore's Law, which describes a long-term trend in the computer hardware industry that involves the doubling of 'compute power' every two years (See: Moore's Law [wikipedia.org]). Technology improvements that 'keep up' with Moore's Law are widely regarded to be doing exceedingly well, making it useful for comparison.

In both graphs, note: (1) the use a logarithmic scale on the Y axis and (2) the sudden and profound out-pacing of Moore's Law beginning in January 2008. The latter represents the time when the sequencing centers transitioned from Sanger-based (dideoxy chain termination sequencing) to 'second generation' (or 'next-generation') DNA sequencing technologies. Additional details about these graphs are provided below.

These data, however, do not capture all of the costs associated with the NHGRI Large-Scale Genome Sequencing Program. The sequencing centers perform a number of additional activities whose costs are not appropriate to include when calculating costs for production-oriented DNA sequencing. In other words, NHGRI makes a distinction between 'production' activities and 'non-production' activities. Production activities are essential to the routine generation of large amounts of quality DNA sequence data that are made available in public databases the costs associated with production DNA sequencing are summarized here and depicted on the two graphs. Additional information about the other activities performed by the sequencing centers is provided below.


DISCUSSIE

Previous reports (5-12) have counted the number of genes exhibiting the overlapping phenomenon, but no reports have enumerated the number of loci or exons that exhibit this overlap. Furthermore, previous reports (5-12) have only described this overlap phenomenon for opposite strands. The present strategy offers a valuable method for estimating the number of overlapping genes, as the total number of genes in the human genome is yet uncertain. Because the total number of genes in the human genome was estimated 32,000 in 2001 (1, 2), and subsequently estimated in 2004 to 22,000.

The total number of exons in the human genome has been estimated at approximately 320,000 (8.8/gene) (1, 2), whereas the present data indicate the existence of more than twice that number. This discrepancy is due to different methods of enumerating exons. We simply counted all of the exons in the human genome, without considering how many exons comprise a gene. This method can identify all exons (e.g., more than 2 exons identified in the same region) and avoids confusion due to splicing variants.

Overlapping genes may evolve as a result of extensions of open reading frames (ORF) caused by switching to an upstream start codon, substitutions in start or stop codons, or deletions and frame shifts that eliminate initiation or stop codons (13). The necessity for maintaining 2 functional overlapping genes inevitably constrains the extent to which both genes can become optimally adapted. However, such constraints can be alleviated by duplication of the overlapping gene pair, allowing for independent evolution of each gene in the resulting copies. This means that overlapping genes can thus only survive long evolutionary periods when the overlap confers a selective advantage upon the organism. In viruses, overlapping genes are thought to persist due to the considerable constraints on genome size (7). In non-viral organisms, the potential advantages of overlapping genes are less clear, although co-regulation may be involved (4). Results of a comparative study of overlapping genes in the genomes of two closely related bacteria revealed that many overlapping genes arise due to incidental elongation of the coding region (16). Overlapping genes have generally been thought to be relatively rare in the human genome, but the results of the present study show that they are more abundant than was previously thought. Interestingly, overlapping genes do not appear to be the result of evolutionary pressure to minimize the size of the human genome.

Yelin et al. (17) demonstrated by in vitro experiments that antisense transcription occurs widely in the human genome. The resulting data set of 2,667 sense-antisense pairs was evaluated by microarrays containing strand-specific oligonucleotide probes derived from the region of overlap. Verification of specific cases by Northern blot analysis with strand-specific riboprobes confirmed the occurrence of transcription from both DNA strands. While these authors also predicted the existence of approximately 1,600 sense-antisense transcriptional units, transcribed from both DNA strands (13), no overlapping patterns were elucidated.

Adachi-N et al. (18) reported that some genes overlap in a head-to-head manner (transcribed in opposite directions), while Koyanagi-KO et al. (19) recently reported the occurrence of bidirectional gene pairs in some species. However, they did not describe the patterns of the overlapping exons. In our study, this type of overlap was included in the overlapping loci identified. It has also been reported that divergence (bidirectionality) is frequently observed, particularly in genes involved in DNA repair or replication.(18). The functional significance of this is unclear, but divergence may permit two genes to share one CpG island for purposes of coordinated expression. In some bidirectional loci, expression of two divergent genes has been found to be coregulated, and promoters exhibiting bidirectional activity have often been observed (20, 21). To the best of our knowledge, the phenomenon of overlapping exons is not specific in DNA repair or replication, and further studies are needed to clarify the functional significance of overlapping genes.

Clarification of overlapping genes will facilitate the description of roles for each strand of the human genome and will provide insight into the mechanisms of evolution.

These results show that all overlapping types are distributed throughout the human genome, but that distributions differ for each chromosome.


Bekijk de video: Chromosomen (Januari- 2022).