Informatie

Hoe download ik het volledige menselijke genoom voor lokale blast-formattering en zoeken?


Ik probeer een kopie te maken van het hele menselijke genoom voor lokale blastquery's op mijn machine. Ik begrijp dat ik het hier van de NCBI FTP-server moet downloaden...

ftp://ftp.ncbi.nih.gov/genomes/Homo_sapiens

Na het downloaden moet ik het formatteren in een database die blast kan doorzoeken. Ik doe dit met behulp van het makeformatdb-commando van NCBI. Het wordt zo uitgevoerd…

makeblastdb -in geheel_menselijk_genoom.fasta -dbtype nucl -titel menselijk_genoom -uit menselijk_genoom.db

Mijn vraag is... Waar haal ik het fasta-bestand met het volledige menselijke genoom vandaan? Download ik de fasta-bestanden voor alle 22 chromosomen, het X-chromosoom en vervolgens het Y-chromosoom en voeg ik ze samen? Is er een fasta-bestand op de site met het hele genoom? Een fasta-bestand dat niet is gepartitioneerd op chromosoom?


Je kunt de individuele chromosomen van NCBI downloaden en samenvoegen of je leven gemakkelijker maken en een enkel fasta-bestand downloaden van Gencode (merk op dat dit de primaire assembly is, als je degene met haplotypes wilt, dan is het hier).

Na dat allemaal te hebben geschreven, zijn de "human_genomic"-bestanden op de NCBI FTP-server de vooraf gebouwde explosiedatabases voor mensen.


Hoe download ik het volledige menselijke genoom voor lokale blast-formattering en zoeken? - Biologie

Een database met informatie over de structuur van geassembleerde genomen, namen van assemblages en andere metagegevens, statistische rapporten en links naar genomische sequentiegegevens.

Een verzameling genomics-, functionele genomics- en genetica-onderzoeken en links naar de resulterende datasets. Deze bron beschrijft de reikwijdte, het materiaal en de doelstellingen van het project en biedt een mechanisme om datasets op te halen die vaak moeilijk te vinden zijn vanwege inconsistente annotaties, meerdere onafhankelijke inzendingen en de gevarieerde aard van verschillende gegevenstypen die vaak in verschillende databases zijn opgeslagen.

De dbVar-database is ontwikkeld om informatie te archiveren die verband houdt met grootschalige genomische variatie, waaronder grote inserties, deleties, translocaties en inversies. Naast het archiveren van variatie-ontdekking, slaat dbVar ook associaties op van gedefinieerde varianten met fenotype-informatie.

Bevat sequentie- en kaartgegevens van de hele genomen van meer dan 1000 organismen. De genomen vertegenwoordigen zowel organismen waarvan de sequentie volledig is bepaald als die waarvan de sequentie wordt bepaald. Alle drie de belangrijkste levensdomeinen (bacteriën, archaea en eukaryota) zijn vertegenwoordigd, evenals vele virussen, fagen, viroïden, plasmiden en organellen.

Het Genome Reference Consortium (GRC) blijft verantwoordelijk voor de referentiegenomen van mens en muis. Leden bestaan ​​uit The Genome Center aan de Washington University, het Wellcome Trust Sanger Institute, het European Bioinformatics Institute (EBI) en het National Center for Biotechnology Information (NCBI). De GRC werkt aan het corrigeren van verkeerd weergegeven loci en het dichten van de resterende gaten in de montage. Bovendien probeert de GRC alternatieve assemblages te bieden voor complexe of structureel variante genomische loci. Op de GRC-website (http://www.genomereference.org) kan het publiek genomische regio's bekijken die momenteel worden beoordeeld, genoomgerelateerde problemen melden en contact opnemen met de GRC.

Een database van bekende interacties van HIV-1-eiwitten met eiwitten van menselijke gastheren. Het biedt geannoteerde bibliografieën van gepubliceerde rapporten van eiwitinteracties, met links naar de overeenkomstige PubMed-records en sequentiegegevens.

Een compilatie van gegevens van het NIAID Influenza Genome Sequencing Project en GenBank. Het biedt tools voor analyse van de griepsequentie, annotatie en indiening bij GenBank. Deze bron bevat ook links naar andere bronnen voor griepsequenties en publicaties en algemene informatie over griepvirussen.

Een project voor het verzamelen en analyseren van genomische sequenties van bacteriële pathogenen afkomstig van voedsel-, omgevings- en patiëntisolaten. Momenteel clustert en identificeert een geautomatiseerde pijplijn sequenties die voornamelijk worden geleverd door volksgezondheidslaboratoria om te helpen bij het onderzoek naar uitbraken van door voedsel overgedragen ziekten en om mogelijke bronnen van voedselbesmetting te ontdekken.

Een verzameling nucleotidesequenties uit verschillende bronnen, waaronder GenBank, RefSeq, de Third Party Annotation (TPA)-database en PDB. Zoeken in de Nucleotide-database levert beschikbare resultaten op van elk van de samenstellende databases.

Database van verwante DNA-sequenties die afkomstig zijn uit vergelijkende studies: fylogenetisch, populatie, milieu en, in mindere mate, mutatie. Elk record in de database is een reeks DNA-sequenties. Een populatieset geeft bijvoorbeeld informatie over genetische variatie binnen een organisme, terwijl een fylogenetische set sequenties en hun uitlijning kan bevatten van een enkel gen dat is verkregen van verschillende verwante organismen.

Een openbaar register van nucleïnezuurreagentia ontworpen voor gebruik in een breed scala aan biomedische onderzoekstoepassingen, samen met informatie over distributeurs van reagens, de effectiviteit van probes en overeenkomsten in berekende sequenties.

Een verzameling bronnen die specifiek zijn ontworpen om het onderzoek naar retrovirussen te ondersteunen, waaronder een genotyperingstool die het BLAST-algoritme gebruikt om het genotype van een querysequentie te identificeren een uitlijningstool voor globale uitlijning van meerdere sequenties een hiv-1 automatische sequentie-annotatietool en geannoteerde kaarten van talrijke retrovirussen die zichtbaar zijn in GenBank, FASTA en grafische formaten, met links naar bijbehorende sequentierecords.

Een samenvatting van gegevens voor het SARS-coronavirus (CoV), inclusief links naar de meest recente sequentiegegevens en publicaties, links naar andere SARS-gerelateerde bronnen en een vooraf berekende uitlijning van genoomsequenties van verschillende isolaten.

Het Sequence Read Archive (SRA) slaat sequentiegegevens op van de volgende generatie sequencingplatforms, waaronder Roche 454 GS System®, Illumina Genome Analyzer®, Life Technologies AB SOLiD System®, Helicos Biosciences Heliscope®, Complete Genomics® en Pacific Biosciences SMRT® .

Een opslagplaats van DNA-sequentiechromatogrammen (sporen), base-aanroepen en kwaliteitsschattingen voor single-pass reads van verschillende grootschalige sequencing-projecten.

Een breed scala aan bronnen, waaronder een korte samenvatting van de biologie van virussen, links naar virale genoomsequenties in Entrez Genome, en informatie over virale referentiesequenties, een verzameling referentiesequenties voor duizenden virale genomen.

Een uitbreiding van de Influenza Virus Resource naar andere organismen, die een interface biedt voor het downloaden van sequentiesets van geselecteerde virussen, analysetools, inclusief virusspecifieke BLAST-pagina's en pijplijnen voor genoomannotatie.

Downloads

Deze site bevat genoomsequentie- en kaartgegevens voor organismen in Entrez Genome. De gegevens zijn geordend in mappen voor afzonderlijke soorten of groepen van soorten. Kaartgegevens worden verzameld in de map MapView en zijn geordend op soort. Zie het README-bestand in de hoofdmap en de README-bestanden in de soort-submappen voor gedetailleerde informatie.

Bevat mappen voor elk genoom met beschikbare kaartgegevens voor huidige en eerdere builds van dat genoom.

Deze site bevat alle nucleotide- en eiwitsequentierecords in de Reference Sequence (RefSeq)-collectie. De map ""release"" bevat de meest recente release van de volledige collectie, terwijl gegevens voor geselecteerde organismen (zoals mens, muis en rat) beschikbaar zijn in aparte mappen. Gegevens zijn beschikbaar in FASTA en platte bestandsformaten. Zie het README-bestand voor details.

Deze site bevat SKY-CGH-gegevens in ASN.1-, XML- en EasySKYCGH-formaten. Zie het bestand skycghreadme.txt voor meer informatie.

Deze site bevat sequencinggegevens van de volgende generatie, georganiseerd door het ingediende sequencingproject.

Deze site bevat de gegevens van het sporenchromatogram, geordend per soort. Gegevens omvatten chromatogram, kwaliteitsscores, FASTA-reeksen van automatische basisaanroepen en andere aanvullende informatie in door tabs gescheiden tekst en XML-indelingen. Zie het README-bestand voor details.

Deze site bevat shotgun-sequentiegegevens van het hele genoom, georganiseerd door de 4-cijferige projectcode. Gegevens omvatten platte bestanden van GenBank en GenPept, kwaliteitsscores en samenvattende statistieken. Zie het bestand README.genbank.wgs voor meer informatie.

Inzendingen

Een online formulier dat onderzoekers, consortia en organisaties een interface biedt om hun BioProjecten te registreren. Dit dient als uitgangspunt voor het aanleveren van genomische en genetische gegevens voor het onderzoek. De gegevens hoeven niet te worden ingediend op het moment van registratie van BioProject.

Een opdrachtregelprogramma dat het aanmaken van sequentierecords voor verzending naar GenBank automatiseert met behulp van veel van dezelfde functies als Sequin. Het wordt voornamelijk gebruikt voor het indienen van volledige genomen en grote batches sequenties.

Deze link beschrijft hoe indieners van SRA-gegevens een veilige NCBI FTP-site voor hun gegevens kunnen verkrijgen, en beschrijft ook de toegestane gegevensformaten en directorystructuren.

Eén toegangspunt voor indieners om te linken naar en informatie te vinden over alle processen voor het indienen van gegevens bij NCBI. Momenteel dient dit als interface voor de registratie van BioProjecten en BioSamples en het aanleveren van gegevens voor WGS en GTR. Toekomstige toevoegingen aan deze site zijn gepland.

Deze link beschrijft hoe indieners van traceergegevens een veilige NCBI FTP-site voor hun gegevens kunnen verkrijgen, en beschrijft ook de toegestane gegevensformaten en directorystructuren.

Gereedschap

Een interactieve grafische viewer waarmee gebruikers variant-oproepen, genotype-oproepen en ondersteunend bewijs (zoals uitgelijnde sequentielezingen) kunnen verkennen die zijn geproduceerd door het 1000 Genomes Project.

Voert een BLAST-zoekopdracht uit naar vergelijkbare sequenties van geselecteerde volledige eukaryote en prokaryotische genomen.

Voert een BLAST-zoekopdracht uit van de genomische sequenties in de RefSeqGene/LRG-set. De standaardweergave biedt kant-en-klare navigatie om uitlijningen in de grafische weergave te bekijken.

Deze tool vergelijkt nucleotide- of eiwitsequenties met genomische sequentiedatabases en berekent de statistische significantie van overeenkomsten met behulp van het Basic Local Alignment Search Tool (BLAST)-algoritme.

Een genoombrowser voor interactieve navigatie van eukaryote RefSeq-genoomassemblages met uitgebreide inspectie van gen, expressie, variatie en andere annotaties. GDV biedt eenvoudig te laden analytische track-preconfiguraties, een menu met datatracks voor eenvoudige weergave en aanpassing, en ondersteunt het uploaden en analyseren van gebruikersgegevens. Deze browser maakt ook de productie van displays voor publicatie mogelijk.

Een online tool die helpt bij de productie van tijdschriftkwaliteitscijfers van annotaties op een ideogram of reeksweergave van een assembly.

Met de Remap-tool van NCBI kunnen gebruikers annotatiegegevens projecteren en locaties van kenmerken van de ene genomische assemblage naar de andere of naar RefSeqGene-sequenties converteren via een base-by-base-analyse. Er worden opties geboden om de strengheid van het opnieuw toewijzen aan te passen, en samenvattende resultaten worden op de webpagina weergegeven. Volledige resultaten kunnen worden gedownload om te worden bekeken in NCBI's Genome Workbench grafische viewer, en annotatiegegevens voor de opnieuw toegewezen functies, evenals samenvattingsgegevens, zijn ook beschikbaar om te downloaden.

Een geïntegreerde applicatie voor het bekijken en analyseren van sequentiegegevens. Met Genome Workbench kunt u gegevens bekijken in openbaar beschikbare sequentiedatabases bij NCBI en deze gegevens mixen met uw eigen gegevens.

Ondersteunt het vinden van menselijke fenotype/genotype-relaties met zoekopdrachten op fenotype, chromosoomlocatie, gen en SNP-ID's. Bevat momenteel informatie uit dbGaP, de NHGRI GWAS-catalogus en GTeX. Geeft resultaten weer op het genoom, op sequentie of in tabellen om te downloaden.

Een hulpprogramma voor het berekenen van uitlijning van eiwitten met genomische nucleotidesequentie. Het is gebaseerd op een variatie van het wereldwijde uitlijningsalgoritme van Needleman Wunsch en houdt specifiek rekening met introns en splitsingssignalen. Dankzij dit algoritme is ProSplign nauwkeurig in het bepalen van splitsingsplaatsen en tolerant voor sequentiefouten.

Sequence Cytogenetic Conversion Service Een online tool die sequentie- en cytogenetische coördinaten converteert voor genomische assemblages van mensen, ratten, muizen en fruitvliegen. Sequentieviewer

Biedt een configureerbare grafische weergave van een nucleotide- of eiwitsequentie en functies die op die sequentie zijn geannoteerd. Naast gebruik op NCBI-reeksdatabasepagina's, is deze viewer beschikbaar als een insluitbare webpaginacomponent. Gedetailleerde documentatie, inclusief een API-referentiegids, is beschikbaar voor ontwikkelaars die de viewer in hun eigen pagina's willen insluiten.

Een hulpprogramma voor het berekenen van cDNA-naar-genomische sequentie-uitlijningen. Het is gebaseerd op een variatie van het wereldwijde uitlijningsalgoritme van Needleman-Wunsch en houdt specifiek rekening met introns en splitsingssignalen. Dankzij dit algoritme is Splign nauwkeurig in het bepalen van splitsingsplaatsen en tolerant voor sequentiefouten.

Variation Viewer Een genomische browser om genomische variaties in dbSNP-, dbVar- en ClinVar-databases te zoeken en te bekijken. Zoekopdrachten kunnen worden uitgevoerd met behulp van chromosomale locatie, gensymbool, fenotype of variant-ID's van dbSNP en dbVar. De browser maakt verkenning van resultaten mogelijk in een dynamische grafische reeksviewer met geannoteerde variatietabellen. Virale genotyperingstool

Deze tool helpt bij het identificeren van het genotype van een virale sequentie. Een venster wordt langs de zoeksequentie geschoven en elk venster wordt door BLAST vergeleken met elk van de referentiesequenties voor een bepaald virus.


Vertaling

De code van het leven kraken

PBS Uitzending: 17 april 2001

ROBERT KRULWICH: Als ik hiernaar kijk, zijn dit de drie miljard chemische letters, instructies voor een mens en mijn ogen glanzen. Maar als wetenschapper Eric Lander hiernaar kijkt, ziet hij verhalen.

ERIC LANDER (Whitehead Instituut/MIT): Het genoom is een verhalenboek dat al een paar miljard jaar wordt bewerkt. En je zou het naar bed kunnen nemen als Duizend-en-een-Arabische Nacht, en elke avond een ander verhaal in het genoom lezen.

ROBERT KRULWICH: Dit is het verhaal van een van de grootste wetenschappelijke avonturen ooit, en de kern ervan is een klein, zeer krachtig molecuul, DNA.

De afgelopen tien jaar hebben wetenschappers over de hele wereld nauwgezet geprobeerd de kleine instructies te lezen die in ons DNA zijn begraven. En nu, eindelijk, is het "Menselijke Genoom" gedecodeerd.

J. CRAIG VENTER (Voorzitter, Celera Genomics): We zijn op het moment waar wetenschappers op wachten. Dit is wat we wilden doen, weet je? We onderzoeken en interpreteren nu de genetische code.

FRANCIS COLLINS (Nationaal Instituut voor Menselijk Genoomonderzoek): Dit is het ultiem denkbare dat men wetenschappelijk zou kunnen doen. is om naar ons eigen instructieboek te gaan kijken en dan te proberen erachter te komen wat het ons vertelt.

ROBERT KRULWICH: En wat het ons vertelt is zo verrassend en zo vreemd en zo onverwacht. Vijftig procent van de genen in een banaan zit in ons?

ERIK LANDER: Hoe anders ben jij dan een banaan?

ROBERT KRULWICH: Ik voel. en ik voel dat ik dit met enige autoriteit kan zeggen. heel anders dan een banaan.

ERIK LANDER: Misschien voel je je anders.

ROBERT KRULWICH: Ik eet een banaan.

ERIK LANDER: Alle machines om je DNA te repliceren, alle machines om de celcyclus te controleren, het celoppervlak, voor het maken van voedingsstoffen, dat is allemaal hetzelfde."

ROBERT KRULWICH: Dus wat heeft al deze informatie met jou of mij te maken? Misschien wel meer dan we ons ooit kunnen voorstellen. Wie van ons krijgt kanker of artritis of de ziekte van Alzheimer? Zullen er genezingen zijn? Zullen ouders in de toekomst de genetische bestemming van hun kinderen kunnen bepalen?

ERIK LANDER: We hebben hier een doos geopend die een enorme hoeveelheid waardevolle informatie bevat. Het is de sleutel tot het begrijpen van ziekten en op de lange termijn tot het genezen van ziekten. Maar nadat we het hebben geopend, zullen we ons de komende tijd ook erg ongemakkelijk voelen met die informatie.

ROBERT KRULWICH: Ja, sommige informatie die u te zien krijgt, zal u erg ongemakkelijk maken. Aan de andere kant, een deel ervan denk ik dat je geweldig en hoopvol zult vinden.

Ik ben Robert Krulwich. En vanavond zullen we niet alleen verslag doen van de laatste ontdekkingen van het Human Genome-project, je zult ook de mensen ontmoeten die deze ontdekkingen mogelijk hebben gemaakt en die furieus hebben gestreden om als eerste gedaan te worden.

En terwijl u ons programma over het menselijk genoom bekijkt, zullen we een aantal kwesties aan de orde stellen: genen en privacy, genen en bedrijfswinsten, genen en de vreemde gelijkenis tussen u en de gist. En we willen graag uw mening hebben over al deze onderwerpen. Dus alsjeblieft, als je wilt, log in op NOVA's Website & mdashit's op pbs.org. het zal er zijn na de uitzending, dus doe het na de uitzending&mdash waar je een enquête kunt invullen. De resultaten zijn onmiddellijk beschikbaar en worden voortdurend bijgewerkt. We zijn zo terug.

Het grootste deel van de financiering voor NOVA wordt verstrekt door de Park Foundation, die zich toelegt op onderwijs en kwaliteitstelevisie.

Dit programma wordt gedeeltelijk gefinancierd door de Northwestern Mutual Foundation. Sommige mensen weten al dat Northwestern Mutual kan helpen bij het plannen van de opvoeding van uw kinderen. Ben je er al? Noordwestelijk wederzijds financieel netwerk.

Wetenschappelijke prestaties worden gevoed door de simpele wens om dingen duidelijk te maken. Sprint PCS is trots om NOVA te ondersteunen.

Grote financiering voor dit programma wordt geleverd door de National Science Foundation, Amerika's investering in de toekomst. En door de Corporation for Public Broadcasting, en door bijdragen aan je PBS-station van kijkers zoals jij. Bedankt.

ROBERT KRULWICH: Laten we om te beginnen vier en een miljard jaar geleden teruggaan naar de plaats waar het eerste spikkeltje leven op aarde verscheen, misschien op het warme oppervlak van een luchtbel. Dat stipje deed iets dat sindsdien ononderbroken is doorgegaan. Het heeft een bericht geschreven. Het was een chemische boodschap die het doorgaf aan zijn kinderen, die het vervolgens doorgaf aan zijn kinderen, en aan zijn kinderen, enzovoort. De boodschap is vanaf het allereerste organisme, helemaal door de tijd heen, naar jou en mij gegaan, als een doorlopende draad door alle levende wezens.

Het is nu natuurlijk uitgebreider, maar die boodschap is, heel eenvoudig, het geheim van het leven. En hier is die boodschap vervat in deze verbluffende kleine constellatie van chemicaliën die we DNA noemen. Je hebt het in deze vorm gezien, de klassieke dubbele helix, maar aangezien we veel tijd zullen besteden aan het praten over DNA, vroeg ik me af: "Hoe ziet het eruit als het rauw is, weet je, in het echte leven ?" Dus vroeg ik het aan een deskundige.

ERIK LANDER: DNA heeft de reputatie zo'n mystiek, hoogdravend soort molecuul te zijn, en dat zal deze informatie, je toekomst, je erfelijkheid. Het is eigenlijk rotzooi. Dus dit is DNA.

ROBERT KRULWICH: Professor Eric Lander is geneticus aan het Whitehead Institute van MIT.

ERIK LANDER: Het zijn heel, heel lange strengen moleculen, deze dubbele helices van DNA, die, als je ze allemaal samenvoegt, er net uit zien als kleine draadjes katoen.

ROBERT KRULWICH: En deze strengen werden letterlijk getrokken uit cellen, bloedcellen of misschien huidcellen van een mens?

ERIK LANDER: Wie dit DNA heeft bijgedragen, je kunt hieruit zien of ze al dan niet een vroeg risico lopen op de ziekte van Alzheimer, je kunt zien of ze al dan niet een vroeg risico lopen op borstkanker. En er zijn waarschijnlijk nog zo'n 2000 andere dingen die je kunt vertellen die we nog niet weten, maar die we wel zullen kunnen vertellen.En het is echt ongelooflijk onwaarschijnlijk dat je dat allemaal kunt zien. Maar dat is DNA voor jou. Dat is blijkbaar het geheim van het leven dat daar gewoon aan de buis hangt.

ROBERT KRULWICH: En DNA heeft ons al dingen verteld die niemand ons heeft verteld. niemand had verwacht. Het blijkt dat de mens maar twee keer zoveel genen heeft als een fruitvlieg. Hoe kan dat nou? We zijn zulke complexe en prachtige wezens en fruitvliegen. Nou, het zijn fruitvliegjes. DNA vertelt ons ook dat we nauwer verwant zijn aan wormen en gisten dan de meesten van ons ooit hadden kunnen vermoeden.

Maar hoe lees je wat er in een molecuul zit? Als het DNA is, als je het zo draait dat je het vanuit de juiste hoek kunt bekijken, zie je in het midden wat eruitziet als een trap op een ladder. Elke stap bestaat uit twee chemicaliën, cytosine en guanine of thymine en adenine. Ze komen altijd in paren voor, basenparen genoemd, ofwel C en G, of kortweg T en A. Dit is, stap voor stap, een code, drie miljard stappen lang en de formule voor een mens.

ROBERT KRULWICH: We kennen dit ding allemaal, deze vorm is heel vertrouwd.

ERIK LANDER: . dubbele helix.

ROBERT KRULWICH: . dubbele helix. Allereerst vraag ik me af. dit is mijn versie van een DNA-molecuul. Is dit trouwens hoe het eruit ziet?

ERIK LANDER: Nou ja, geven of nemen. Ik bedoel, een tekenfilmversie, ja.

ROBERT KRULWICH: Cartoonversie?

ERIK LANDER: Een beetje zoals dat of zo, ja.

ROBERT KRULWICH: Dus er zijn. in elke. bijna elke cel in je lichaam, als je diep genoeg kijkt, vind je deze ketting hier?

ERIK LANDER: Oh ja, vast in de kern van je cel.

ROBERT KRULWICH: Hoe klein is dit nu, als in een echt DNA-molecuul de afstand tussen de twee muren hoe groot is?

ROBERT KRULWICH: Kijk hiernaar. Hij vraagt ​​om hulp.

ERIK LANDER: Deze afstand is ongeveer van. deze afstand is ongeveer 10 angstrom.

ROBERT KRULWICH: Dat is een miljardste van een meter als het op een heel bijzondere manier is samengeklonterd.

ERIK LANDER: Nou nee, het is zo opgerold, maar je ziet dat het meer is dan dat. Je kunt het niet te veel opkrullen omdat deze kleine negatief geladen dingen elkaar afstoten, dus je vouwt het erop. Ik ga je molecuul breken.

ROBERT KRULWICH: Nee, breek mijn molecuul niet. erg waardevol.

ERIK LANDER: Je hebt dit. En dan is het zo opgevouwen. En die worden dan op elkaar gevouwen. En dus, in feite, als je al het DNA zou uitrekken, zou het lopen, oh, ik weet het niet, duizenden en duizenden voet.

ROBERT KRULWICH: Maar het belangrijkste hiervan is de ladder, de treden van deze ladder. Als ik wist dat het A en T en C en C en G en G en A was.

ERIK LANDER: Nee nee. Het is niet G en G, het is G en C.

ROBERT KRULWICH: Het spijt me, wat de regels van de grammatica ook zijn, ja. als ik elk van de afzonderlijke ladders zou kunnen lezen, zou ik de afbeelding van wat kunnen vinden?

ERIK LANDER: Nou ja, van je kinderen. Dit geef je door aan je kinderen. Je weet dat mensen al 2000 jaar weten dat je kinderen veel op jou lijken. Nou, het is omdat je ze iets moet doorgeven, een paar instructies die ze de ogen geven die ze hebben en de haarkleur die ze hebben en de neusvorm die ze hebben. En de enige manier waarop je het aan hen doorgeeft, is in deze zinnen. Dat is het.

ROBERT KRULWICH: En om je de ware kracht van dit molecuul te laten zien, beginnen we met één atoom diep van binnen, en we trekken ons terug en je ziet het zijn As en T's en C's en G's vormen en de klassieke dubbele spiraal. En dan begint het mysterieuze proces dat een gezonde nieuwe baby creëert. En het interessante is dat elke menselijke baby, elke geboren baby, voor 99,9 procent identiek is in zijn genetische code aan elke andere baby.

Dus de kleinste verschillen in onze genen kunnen enorm belangrijk zijn, kunnen bijdragen aan verschillen in lengte, lichaamsbouw, misschien zelfs talenten, aanleg en kunnen ook verklaren wat kan breken, wat ons ziek kan maken.

Het kraken van de code van die minuscule verschillen in DNA die gezondheid en ziekte beïnvloeden, is waar het bij het Human Genome Project om draait. Sinds 1990 zijn wetenschappers over de hele wereld in laboratoria van universiteiten en overheden betrokken bij een enorme inspanning om alle drie miljard As, T's, G's en C's van het menselijk DNA te lezen.

Ze voorspelden dat het minstens 15 jaar zou duren. Dat kwam deels omdat een wetenschapper in de begindagen van het project jaren kon doorbrengen. een hele carrière bezig om slechts een handvol letters in het menselijk genoom te lezen. Het duurde 10 jaar om de enige genetische fout te vinden die cystische fibrose veroorzaakt. Nog 10 jaar om het gen voor de ZvH te vinden. Vijftien jaar om één van de genen te vinden die het risico op borstkanker verhogen. Letter voor letter, pijnlijk langzaam.

ROBERT WATERSTON: Een twee drie vier vijf.

ROBERT KRULWICH: . frustrerend vatbaar voor fouten.

ROBERT WATERSTON (pionier in het in kaart brengen van DNA): . C's op een rij.

VERTELLER: . en valse aanwijzingen.

We vroegen Dr. Robert Waterston, een pionier in het in kaart brengen van DNA, om ons te laten zien hoe het vroeger deed.

ROBERT WATERSTON: De originele ladders voor DNA-sequenties lezen we eigenlijk door een kleine letter naast de band te leggen die we belden en die daarna op een stuk papier of in de computer te schrijven. Het is verschrikkelijk.

ROBERT KRULWICH: En we hebben het moeilijkste nog niet genoemd. Dit hier, 50.000 keer vergroot, is een echte klomp DNA, chromosoom 17. Als je naar binnen kijkt, vind je natuurlijk honderden miljoenen As, en C's, en Ts en G's, maar het blijkt dat slechts ongeveer één procent van hen is actief en belangrijk. Dit zijn de genen waar wetenschappers naar op zoek zijn. Dus ergens in dit dichte chemische woud zijn genen betrokken bij doofheid, Alzheimer, kanker, staar. Maar waar? Dit is zo'n doolhof dat wetenschappers een kaart nodig hebben. Maar in het oude tempo zou dat bijna een eeuwigheid duren.

ROBERT WATERSTON: C en dan een A.

ROBERT KRULWICH: En toen kwam de revolutie. In de afgelopen tien jaar is het hele proces geautomatiseerd. Dat kostte honderden miljoenen dollars. Maar nu, in plaats van een paar honderd letters met de hand per dag te decoderen, kunnen deze machines er samen duizend per seconde aan en dat heeft het verschil gemaakt.

ROBERT COOK-DEEGAN (Nationale Onderzoeksraad): Dit is iets dat in de studieboeken gaat. Iedereen weet dat. Iedereen, toen het Genome-project werd geboren, was zich bewust van hun rol in de geschiedenis.

ROBERT KRULWICH: De brieven eruit halen is. is beschreven als het vinden van de blauwdruk van een mens, het vinden van een handleiding voor een mens, het vinden van de code van de mens. Wat is jouw metafoor?

ERIK LANDER: Oh, goly jee. Ik bedoel, je kunt heel hoge metaforen hebben voor dit soort dingen. Dit is eigenlijk een onderdelenlijst. Blauwdrukken en al deze fantasie. Het is maar een onderdelenlijst. Het is een onderdelenlijst met veel onderdelen. Als je een vliegtuig neemt, een Boeing 777, denk ik dat het 100.000 onderdelen heeft. Als ik je een onderdelenlijst voor de Boeing 777 zou geven, zou je in zekere zin veel weten. Je zou 100.000 componenten kennen die er moeten zijn, schroeven en draden en roeren en dat soort dingen. Aan de andere kant, ik wed dat je niet zou weten hoe je het in elkaar moet zetten. En ik wed dat je niet zou weten waarom het vliegt. Nou, we zitten in hetzelfde schuitje. We hebben nu een onderdelenlijst. Dat is waar het bij het menselijk genoomproject om draait: het verkrijgen van de onderdelenlijst. Als je het vliegtuig wilt begrijpen, moet je de onderdelenlijst hebben, maar dat is niet genoeg om te begrijpen waarom het vliegt. Natuurlijk zou je gek zijn om niet met de onderdelenlijst te beginnen.

ROBERT KRULWICH: En één reden waarom het zo belangrijk is om al die onderdelen te begrijpen, om elke letter van het genoom te decoderen, is omdat soms, van de drie miljard basenparen in ons DNA, slechts één enkele letter het verschil kan maken.

Allison en Tim Lord zijn ouders van de tweejarige Hayden.

TIM HEER (Vader van zoon met Tay Sachs): De twee dingen waar ik het meest aan denk aan Hayden, die veel mensen vanaf het begin van hem hebben gekregen, is dat hij altijd, dacht ik, erg grappig was. Ik bedoel, hij hield van glimlachen en lachen en hij lachte gewoon. En dit was later, toen hij ongeveer een jaar oud was, vond hij de grappigste dingen gewoon hilarisch. En dus zouden hij en ik elkaar gewoon uitlachen.

ROBERT KRULWICH: Hayden leek zich de eerste paar maanden normaal te ontwikkelen, maar Allison begon te merken dat sommige dingen niet helemaal klopten.

ALLISON HEER (Moeder van zoon met Tay Sachs): Ik was de hele tijd erg angstig met Hayden. Ik voelde dat er iets niet hetzelfde was. Ik zou mijn vrienden de luier zien verschonen van hun kind van ongeveer dezelfde leeftijd, hun pasgeboren baby, en de fysieke beweging zien, en de benen bewegen, en dat soort dingen, en Hayden deed dat niet.

ROBERT KRULWICH: Artsen vertelden hen dat Hayden zich gewoon een beetje langzaam ontwikkelde. Maar tegen de tijd dat hij een jaar oud werd, was het duidelijk dat er iets ernstigs aan de hand was. Hij kroop nooit, hij praatte nooit, hij at nooit met zijn vingers en hij leek achteruit te gaan, niet vooruit.

TIM HEER: Ik herinner me de laatste keer dat hij lachte. En ik ging met hem op reis om een ​​pak op te halen, want we gingen die avond naar een bruiloft, en we kwamen terug en het was erg winderig, en hij houdt gewoon van de wind te voelen, en dus hadden we een geweldige tijd. We kwamen terug en ik zette hem hier op de bank en ik zat naast hem en hij gooide zijn hoofd een beetje achterover en lachte, zoals, weet je, wat een leuke reis, weet je wel? En dat de laatste keer dat hij kon lachen. Dat is echt moeilijk.

ROBERT KRULWICH: Het bleek dat Hayden de ziekte van Tay Sachs had, een genetische aandoening die langzaam de hersenen van een baby vernietigt.

dr. EDWIN KOLODNY (NYU, Afdeling Neurologie): Wat er gebeurt, is dat het kind bij de geboorte normaal lijkt en in de loop van het eerste jaar ontwikkelingsmijlpalen begint te missen. Dus met zes maanden zou een kind zich moeten omdraaien en het kind kan zich niet omdraaien, zitten, staan, lopen of praten.

ROBERT KRULWICH: Tay Sachs begint op een oneindig kleine plek op de DNA-ladder, waar slechts één letter fout gaat. Stel dat dit cluster van atomen een afbeelding is van die letter, dan kan een fout hier neerkomen op slechts vier atomen. Dat is het. Maar omdat genen eiwitten maken, veroorzaakt die fout een probleem in dit eiwit dat het vet in de hersenen zou moeten oplossen. Maar nu werkt het eiwit niet. Dus vet hoopt zich op, zwelt de hersenen op en verstikt en verplettert uiteindelijk kritieke hersencellen. En dit alles is het resultaat van één slechte letter in het DNA van die baby.

dr. EDWIN KOLODNY: In de meeste gevallen gaat het om een ​​enkele basiswijziging. Zoals we zeggen, een letter verschil.

ROBERT KRULWICH: Eén defecte brief op drie miljard, en geen manier om het te repareren.

ROBERT KRULWICH: Tay Sachs is een meedogenloos progressieve ziekte. In het jaar sinds zijn diagnose is Hayden blind geworden. Hij kan geen vast voedsel eten. Het wordt steeds moeilijker voor hem om te slikken. Hij kan zich helemaal niet voortbewegen. En hij heeft aanvallen zo vaak als 10 keer per dag.

dr. EDWIN KOLODNY: Voor kinderen met de klassieke ziekte van Tay Sachs is er maar één uitkomst. En kinderen sterven op de leeftijd van vijf tot zeven jaar, soms zelfs vóór de leeftijd van vijf.

ROBERT KRULWICH: Toevallig heeft Tim Lord een identieke tweelingbroer. Toen Hayden werd gediagnosticeerd, ging die broer, Charlie, naar New York om bij Tim te zijn. En natuurlijk belde Charlie zijn vrouw Blyth om haar het nieuws te vertellen. Blyth was Allisons kamergenoot op de universiteit en haar beste vriendin geweest.

GELIEVE HEER (Moeder van dochter met Tay Sachs): Charlie vertelde me dat Hayden Tay Sachs had. Hij belde me aan de telefoon en hij vertelde me meteen wat het was. Ik ging naar de computer en zocht het op en toen kon ik gewoon niet geloven wat ik las.

ROBERT KRULWICH: Blyth en Charlie hadden een dochtertje van drie, Taylor, en een dochtertje dat Cameron heette. Cameron was gezond en gelukkig, op één klein dingetje na.

GELIEVE HEER: Op de NTSAD-website wordt meestal gesproken over zes tot acht maanden wanneer de tekenen beginnen te komen, maar een van de eerste tekenen is dat ze gemakkelijk schrikken. En Hayden had altijd een heel heftige schrikreactie gehad. Maar we hadden gemerkt dat Cameron een vergelijkbare schrikreactie had. Niet zo ernstig, maar absoluut niet zoals Taylor had gehad.

ROBERT KRULWICH: Zodra ze dat vroege waarschuwingsbord op de Tay Sachs-website zag, ging Blyth zichzelf en Cameron laten testen.

CHARLIE HEER (Moeder van dochter met Tay Sachs): Het was weer een week. Het duurde precies een week voordat we de definitieve resultaten kregen van Camerons bloedonderzoek. En de dinsdag voor Thanksgiving gingen we naar het kantoor van onze kinderarts en hij had de resultaten, en we ontdekten die avond dat Blyth drager was en dat Cameron Tay Sachs had.

GELIEVE HEER: Hij zei. het enige wat hij zei was: "Het spijt me."

ROBERT KRULWICH: Tay Sachs is een zeer zeldzame aandoening en komt meestal voor bij specifieke groepen, zoals Asjkenazische joden. En zelfs dan moet de baby het slechte gen van beide ouders erven. Dus ook al is er een Tay Sachs-test, de Lords hadden geen reden om te denken dat ze gevaar zouden lopen. En toch, ongelooflijk, waren ze alle vier, Tim en Charlie en hun beide echtgenotes en waarschijnlijk vier dragers. Dat was een ongelooflijk slechte worp van de genetische dobbelstenen.

TIM HEER: Charlie en ik zijn ongelooflijk hecht en dat zijn we ons hele leven al geweest. En als ik eraan denk dat hij en Blyth dit moeten meemaken, lijkt het gewoon heel wreed. Het lijkt gewoon te veel.

CHARLIE HEER: Ik had me al voorbereid om de rots van mijn broer te zijn en ik kon me niet voorstellen hem te moeten helpen en er zelf doorheen te moeten.

ROBERT KRULWICH: Voor families zoals de Lords, en voor iedereen, biedt het Human Genome-project de kans om vroeg te ontdekken of we risico lopen op allerlei ziekten.

TIM HEER: Ik zou graag een echt agressieve impuls zien om een ​​test voor honderden genetische ziekten te ontwikkelen, zodat ouders kunnen worden geïnformeerd voordat ze kinderen krijgen over de gevaren waarmee ze worden geconfronteerd. En ik denk dat het binnen ons bereik ligt. Nu ze het menselijk genoom in kaart hebben gebracht, bedoel ik, de informatie is er voor mensen om door te bladeren. Het zijn afschuwelijke, afschuwelijke, afschuwelijke ziekten en als er een manier is waarop je op een hele reeks ervan kunt worden getest zonder dat ze een kind beïnvloeden, denk ik dat we ons daarop moeten concentreren.

ROBERT KRULWICH: Hayden Lord stierf een paar maanden voor zijn derde verjaardag. Wat dit verhaal bijzonder moeilijk te verdragen maakt, is dat we nu weten dat zo'n enorm verlies en dat het een catastrofe was, hoe dan ook, begon met een enkele fout, een paar atomen breed, begraven in een cel.

Dat iets zo kleins zo'n enorm resultaat kan veroorzaken, is een perspectief dat ongelooflijk beangstigend is. Alleen hebben genetici nu ontdekt hoe ze veel van deze kleine fouten kunnen zien voordat ze catastrofes worden. Als je daarover nadenkt, is dat iets buitengewoons, om een ​​catastrofe te spotten terwijl het nog een onbeduidende stip in een cel is, wat de belofte is van het Human Genome Project. Het is in de eerste plaats een systeem voor vroegtijdige waarschuwing voor tal van ziekten dat, hopelijk, ouders, artsen en wetenschappers een voordeel zal geven dat we nog nooit eerder hebben gehad. Want als je problemen ziet aankomen, lang voordat het begint, heb je een kans om het te stoppen of te behandelen. Uiteindelijk zou je het kunnen genezen.

En dat is waarom, toen het Congres in 1990 het Human Genome Project creëerde, de uitdaging was om zo snel mogelijk een volledige lijst van onze As, Ts, Cs en G's te krijgen, zodat het maken van tests, medicijnen en kuren kon beginnen. Ze dachten dat het ongeveer 15 jaar zou duren om een ​​mens te decoderen, en op dat moment leek dat redelijk.

Totdat deze man, wetenschapper, ondernemer en speedbootliefhebber Craig Venter, besloot dat hij het sneller, veel sneller kon.

J. CRAIG VENTER: Het is als zeilen. Zodra je twee zeilboten op het water hebt die ongeveer in dezelfde richting gaan, zijn ze aan het racen. En de wetenschap werkt grotendeels op dezelfde manier. Als je twee labs hebt die op afstand aan hetzelfde werken, probeert men daar sneller te komen, of beter, hogere kwaliteit, iets anders, deels omdat onze samenleving alleen de eerste plaats erkent.

ROBERT KRULWICH: In 1990 was Venter een van de vele overheidswetenschappers die nauwgezet eiwitten en genen decodeerden. Zijn focus was één eiwit in de hersenen.

J. CRAIG VENTER: Het duurde tien jaar om het eiwit te krijgen en het duurde een heel jaar om 1000 letters genetische code te krijgen.

ROBERT KRULWICH: Voor Venter was dat veel te traag.

Dus je zit daar te denken dat er een betere manier moet zijn als je uit het raam staart?

J. CRAIG VENTER: Ja, er moest een betere manier zijn.

ROBERT KRULWICH: En toen hoorde hij dat iemand een nieuwe machine had uitgevonden die C's en T's en As en G's met opmerkelijke snelheid kon identificeren. En Craig Venter houdt gewoon van machines die snel gaan.

J. CRAIG VENTER: Ik heb meteen contact opgenomen met het bedrijf om te kijken of ik een van de eerste machines kon krijgen.

ROBERT KRULWICH: En hier is hoe ze werken. Menselijk DNA wordt door robots in kleine stukjes gehakt. Deze stukjes worden keer op keer gekopieerd in bacteriën en vervolgens getagd met gekleurde kleurstoffen. Een laser weerkaatst licht van elk stukje DNA en de kleuren die hij ziet, vertegenwoordigen individuele letters in de genetische code. En deze computers kunnen dit 24 uur per dag, elke dag.

J. CRAIG VENTER: Dus nu kun je duidelijk de toppen zien.

J. CRAIG VENTER: Dus er komt gewoon een blauwe aan, dus dat is een C die eraan komt. Je zou dit kunnen lezen en je zou dit allemaal kunnen opschrijven.

ROBERT KRULWICH: Dus blauw, geel, rood, rood, geel.

J. CRAIG VENTER: Dus dat is C,G,T,T,A.

ROBERT KRULWICH: Dan moeten op de een of andere manier al deze kleine stukjes weer in de juiste volgorde in elkaar worden gezet. Venter's droom was om honderden nieuwe machines binnen handbereik te hebben, dus zei hij zijn baan bij de overheid op en richtte hij een bedrijf op dat hij Celera Genomics noemde. Celera van het Latijnse woord celerity, wat snelheid betekent. En dit is wat hij heeft gebouwd.

Oh mijn god. En weet je waarom dat interessant is? Er is hier bijna niemand.

J. CRAIG VENTER: Ja, het is allemaal geautomatiseerd.

ROBERT KRULWICH: Dus, wie is deze man en waarom is hij zo'n bulldog voor snelheid?

Craig Venter groeide op in Californië, verliet de middelbare school en bracht een jaar door als surfende zwerver overdag op het strand en 's nachts als stockjongen bij Sears. Hij werd onvermijdelijk opgeroepen en ging met de marine naar Vietnam. Dat is hem helemaal daar aan de linkerkant. Hij werd uiteindelijk toegewezen aan een marinehospitaal in Danang tijdens het Tet-offensief toen Amerikanen zeer zware verliezen leden. Op 21-jarige leeftijd zat hij in de triage-eenheid, waar ze beslissen wie zal leven en wie zal sterven.

Als je jong bent en je ziet veel mensen sterven en ze zouden allemaal jou kunnen zijn, heb je dan het gevoel dat je ze een soort genezing verschuldigd bent? Genezingen die ze nooit zullen krijgen? Of ben ik aan het romantiseren?

J. CRAIG VENTER: Welnu, de motivaties worden complex. Dat is er zeker een onderdeel van. Ik denk ook dat ik het jaar dat er was, overleefde. het zet de zaken een beetje in perspectief, denk ik. Als je niet in die situatie zit, kun je het nooit echt in perspectief zien.

ROBERT KRULWICH: Je hoort tijd. hoor je tikken?

J. CRAIG VENTER: Ja. Maar ik heb ook het gevoel dat ik deze geweldige gave al die jaren heb gehad sinds ik terugkwam in 1968, en ik wilde er zeker van zijn dat ik er iets mee deed.

ROBERT KRULWICH: In het voorjaar van 1998 kondigde Venter aan dat hij en zijn bedrijf in twee jaar tijd alle drie miljard letters van het menselijk genoom zouden gaan sequensen. Vergeet niet dat de regering zei dat het 15 zou duren.

J. CRAIG VENTER: Er was veel arrogantie die gepaard ging met dat programma. Ze zouden het in hun tempo doen. En veel van de wetenschappers, weet je, als ze echt eerlijk tegen je waren, zouden je vertellen dat ze van plan waren met pensioen te gaan met dit programma. Dat is niet wat wij denken dat de juiste manier is om aan wetenschap te doen, vooral niet aan wetenschap die het leven van zoveel mensen beïnvloedt.

ROBERT KOK-DEEGAN: Craig is een man met een hoog testosterongehalte. hij vindt het gewoon heerlijk om een ​​beeldenstormer te zijn. Rechts? Hij houdt ervan om in de kooien van mensen te rammelen en dat heeft hij consequent gedaan in het genoomproject.

ROBERT KRULWICH: De aankondiging van Craig Venter dat zijn team het hele genoom in slechts twee jaar zou afmaken, bracht iedereen die aan het openbare project werkte enthousiast. Nu waren ze aan het klauteren om bij te blijven.

MENSELIJK GENOOM PROJECT MEDEWERKER: Er zijn enkele beperkingen. We denken niet dat we dit ding op dit moment sneller kunnen laten gaan zonder er veel meer robotica tegenaan te gooien. De arm doet er fysiek twintig seconden over.

ROBERT KRULWICH: Francis Collins, het hoofd van het Human Genome Project, was vastbesloten dat Celera zijn teams niet zou verslaan met de prijs. Hij nam de dramatische beslissing om te proberen vijf volle jaren van het oorspronkelijke plan af te halen.

FRANCIS COLLINS: Toen de grote genoomcentra elkaar ontmoetten en ermee instemden om hier failliet te gaan, denk ik niet dat er iemand in de zaal was die er zeker van was dat we dat konden doen. Ik bedoel, je zou met een stuk papier kunnen gaan zitten en projecties maken, als alles echt goed zou gaan, zou dat je daar kunnen brengen, maar er waren zoveel manieren waarop dit volledig van de baan kon zijn.

ROBERT KRULWICH: Bij het MIT besloten ze om hun inspanningen 15-voudig op te schalen en dat betekende een grote verandering in hun gebruikelijke academische tempo.

LAUREN LINTON (MIT): We hadden eigenlijk een doel sinds maart om tot een plaat-per-minuut operatie van baarmoeder tot graf helemaal door te komen.

ROBERT KRULWICH: In de herfst van 1999 komen vertegenwoordigers van de vijf grote laboratoria kijken naar de werking van Eric Lander. Alle grote honcho's in het Human Genome Project zijn hier: wetenschappers van de Washington University in St. Louis, Baylor College of Medicine in Texas, het Department of Energy. Ze komt uit het Sanger Centre in Engeland. Als ze het genoom vóór Craig Venter willen afmaken, moeten deze mensen uitvinden hoe ze hun labs kunnen uitrusten met veel nieuwe, mooie en onbekende apparatuur. En ze moeten het snel doen.

LAUREN LINTON: Dus we zullen een soort kanaal moeten aanleggen.

ROBERT KRULWICH: Bij MIT komt er bijna dagelijks een ander krat binnen.

MIT PERSONEEL ONDERZOEKER EEN: Het is net Kerstmis, iedereen pakt iets uit.

ROBERT KRULWICH: Net als een slecht kerstcadeau, is montage vereist. En de instructies zijn natuurlijk niet altijd even duidelijk.

MIT PERSONEEL ONDERZOEKER TWEE: Oh nee, de magneetplaten plakken aan elkaar?

MIT PERSONEEL ONDERZOEKER DRIE: . plus of min drie voet.

ERIK LANDER: Omdat iemand op het scherpst van de snede is. Ik denk dat ze het altijd 'de bloedende rand' noemen, toch? Niets werkt echt zoals je verwacht. Alle dingen die we doen zullen perfect werken zodra we klaar zijn om het te vervuilen.

ROBERT KRULWICH: De MIT-crew is bijzonder enthousiast over hun gloednieuwe, ultramoderne DNA-zuiveringsmachine van driehonderdduizend dollar.

MIT PERSONEEL ONDERZOEKER VIER: Waarom zet je het niet aan.

MIT PERSONEEL ONDERZOEKER DRIE: Oké, maidentrip. Er werd niet om een ​​wachtwoord gevraagd. Dat is goed.

MIT PERSONEEL ONDERZOEKER VIER: Moet je meteen het gele licht krijgen?

ROBERT KRULWICH: Ik denk niet dat het knipperende lampje een goed teken is.

ERIK LANDER: Het is net alsof je een heel groot vliegtuig bestuurt en het repareert terwijl je vliegt. Je wilt weten wat er is misgegaan. En je realiseert je ook dat je, o, tienduizenden dollars per uur uitgeeft. Dus je voelt een beetje druk om dit zo snel mogelijk uit te werken.

ROBERT KRULWICH: Dus belt hij de klantenservice. En natuurlijk wordt hij in de wacht gezet. Dus hij wacht. En hij wacht. En hij wacht. Hoe dan ook, het blijkt dat de machine van driehonderdduizend dollar een klein klepje heeft dat kapot is, en dus werkt het niet.

ERIK LANDER: Je weet nooit of het probleem te wijten is aan een robot, een of andere gekke biochemie, een chemische stof die niet echt werkt. En dus is het ongelooflijk ingewikkeld.

MIT PERSONEEL ONDERZOEKER VIJF: We hebben dus een testtransformatie waarbij we een tiende van onze ligatie transformeren.

MIT PERSONEEL ONDERZOEKER ZES: En voeg SDS toe om de faag te lyseren.

MIT PERSONEEL ONDERZOEKER ZEVEN: En al onze thermocyclers hebben platen met drie en vierentachtig putjes.

MIT PERSONEEL ONDERZOEKER ACHT: Dus als je in principe bepaalt waar je 96 goed zit. plaatputjes bevonden zich op deze plaat met driehonderdvierentachtig putjes en gaven ze elk een andere run-module.

FRANCIS COLLINS: Wanneer je iets probeert op te voeren, wordt alles dat ook maar een beetje onhandig is, plotseling een groot knelpunt.

MIT PERSONEEL ONDERZOEKER NEGEN: We hadden het erover om vandaag een volledige test te doen en we voelden ons daar nog niet goed bij.

FRANCIS COLLINS: Er was een aanzienlijk gevoel van witte knokkels onder ons allemaal, want hier hadden we deze belofte gedaan. We hebben hier officieel gezegd dat we dit gaan doen. En dingen werkten niet. De machines gingen kapot. Het moet nu werken. De tijd raakt op.

ROBERT KRULWICH: Het heeft even geduurd, maar de regeringsteams kwamen eindelijk op gang.

FRANCIS COLLINS: De herfst van dat jaar was eigenlijk een soort van bepalende tijd. De centra hebben echt hun moed bewezen. En elk van hen begon deze stijgende bocht te vangen en erop te rijden. En we begonnen gegevens te zien verschijnen met wonderbaarlijke snelheden. Begin 2000 rolden duizend basenparen per seconde uit deze gecombineerde onderneming, zeven dagen per week, 24 uur per dag, duizend basenparen per seconde. Dan begint het echt te gaan.

ROBERT KRULWICH: En die duizenden basenparen stroomden rechtstreeks uit de universitaire laboratoria op internet, elke nacht bijgewerkt. Het is voor iedereen beschikbaar, ook voor de concurrentie.

Celera geeft toe dat ze veel gegevens rechtstreeks van de overheid hebben gekregen. En Tony White, die het bedrijf runt dat eigenaar is van Celera, zegt: "Waarom niet?"

TONY WIT: Dat zijn openbaar beschikbare gegevens. Ik ben een belastingbetaler. Celera is een belastingbetaler. Weet je, het is openbaar. waarom zouden we uitgesloten moeten worden van het krijgen ervan? Ik bedoel, nogmaals, creëren ze het om het aan de mensheid te geven, behalve Celera? Is dat het idee? Het gaat er niet om dat wij de gegevens krijgen. Het gaat over deze academische jaloezie. Het gaat over het feit dat onze gegevens, in combinatie met die van hen, ons een waargenomen, oneerlijk voordeel geven ten opzichte van deze zogenaamde 'race'.

ERIK LANDER: Als ze met ons willen racen, is dat hun zaak.

ROBERT KRULWICH: Natuurlijk doen ze dat. nietwaar?

ERIK LANDER: Ik veronderstel dat ze dat kunnen.

ROBERT KRULWICH: Ik vermoed sterk van wel.

ERIK LANDER: Het is onze taak om die gegevens naar buiten te brengen, zodat iedereen ze kan gaan gebruiken.

ROBERT KRULWICH: Aangezien Celera het genoom sequensde met privégeld, vroegen sommige critici zich af: "Waarom zou de overheid zoveel geld in exact hetzelfde onderzoek steken?"

ERIK LANDER: In de Verenigde Staten hebben we in de jaren vijftig geïnvesteerd in een nationaal wegennet. We kregen een enorm rendement voor het gratis aanleggen van wegen en het laten rijden van iedereen voor welk doel dan ook. We bouwen gratis een weg op en neer langs de chromosomen. Mensen kunnen die chromosomen op en neer rijden voor alles wat ze willen. Ze kunnen ontdekkingen doen. Ze kunnen leren over medicijnen. Ze kunnen de geschiedenis leren. Wat ze maar willen. Het is de publieke investering waard om die wegen beschikbaar te maken.

ROBERT KRULWICH: Maar wacht even - Wat ik echt wil weten is, als je een routekaart van een mens maakt, welke mensen brengen we dan in kaart? Ik bedoel, mensen zijn er in zoveel soorten, dus naar wiens genen kijken we precies?

ERIK LANDER: Het is meestal een man uit Buffalo en een vrouw uit Buffalo. Dat komt omdat het laboratorium.

ROBERT KRULWICH: Wauw, wauw. Een anoniem stel uit Buffalo?

ERIK LANDER: Nee, ze zijn geen stel. Ze zijn geen stel. Ze hebben elkaar nooit ontmoet.

ERIK LANDER: Het laboratorium was een laboratorium in Buffalo. En dus plaatsten ze een advertentie in Buffalo-kranten en kregen ze willekeurige vrijwilligers uit Buffalo. Ze kregen er ongeveer 20 en kozen willekeurig deze steekproef en die steekproef en die steekproef. Dus niemand weet wie ze zijn.

ROBERT KRULWICH: En hoe zit het met Celera? Wiens DNA brengen ze in kaart?

Ze kregen ook een stel vrijwilligers, ongeveer 20, en kozen vijf gelukkige winnaars.

J. CRAIG VENTER: We hebben geprobeerd om wat diversiteit te hebben in termen van. we hadden een Afro-Amerikaan, iemand van zelfverklaarde Chinese afkomst, twee blanken en een Hispanic. En dus waren enkele vrijwilligers hier op het personeel, en.

ROBERT KRULWICH: Ik moet het vragen, want dat doet iedereen. Hoor jij bij hen?

J. CRAIG VENTER: Ik ben een van de vrijwilligers, ja.

ROBERT KRULWICH: Oh. Weet u of u, of u een van de winnaars bent?

J. CRAIG VENTER: Ik heb een redelijk goed idee, ja. Maar dat kan ik niet onthullen. Omdat het niet uitmaakt.

ROBERT KRULWICH: Nou, als je het hoofd van het bedrijf bent en je kijkt naar de decodering van "moi", dan heeft dat een beetje Miss Piggy-kwaliteit.

J. CRAIG VENTER: Nou, elke wetenschapper die ik ken zou graag naar hun eigen genetische code kijken. Ik bedoel, hoe kon je niet op dit gebied willen en werken?

ROBERT KRULWICH: Nou, ik weet het niet, ik werk niet op dit gebied. Maar ik vraag me af of een kleine groep, ik bedoel, die man uit Buffalo, echt een stand-in zou kunnen zijn voor de hele mensheid? Is het ons niet vanaf onze geboorte ingeprent dat we allemaal verschillend zijn, en dat ieder van ons volledig uniek is? We zien er zeker anders uit. Mensen zijn er in zoveel vormen en kleuren en maten dat het DNA van deze mensen aanzienlijk moet verschillen van het DNA van deze mens. Rechtsaf?

ERIK LANDER: Het genetische verschil tussen twee mensen: een tiende van een procent. Die twee, en elke twee mensen op deze planeet zijn voor 99,9 procent identiek op DNA-niveau. Het is maar één letter op duizend verschil.

ROBERT KRULWICH: En als ik stiekem een ​​andere kamer binnen zou brengen, een zwarte man, een Aziatische man en een blanke man, en je alleen hun genetische code zou laten zien, zou je dan kunnen zien welke de blanke was.

Wat gebeurd er? Het vertelt ons dat, ten eerste, we als soort zeer, zeer nauw verwant zijn. Omdat twee mensen voor 99,9 procent identiek zijn, betekent dat we veel nauwer verwant zijn dan twee chimpansees in Afrika.

ROBERT KRULWICH: Wacht wacht. Wacht, wacht, wacht, wacht. Je bedoelt als twee chimpansees door het bos slingeren en je kijkt naar de genen van chimpansee A en de genen van chimpansee B.

ERIK LANDER: Het gemiddelde verschil tussen die chimpansees is vier of vijf keer meer dan het gemiddelde verschil tussen twee mensen dat je van deze planeet zou plukken.

ROBERT KRULWICH: Omdat we zo'n jonge soort zijn?

ERIK LANDER: Klopt. Kijk, het punt is, we zijn de afstammelingen van een zeer kleine oprichtende populatie. Elk mens op deze planeet gaat terug naar een oorspronkelijke bevolking van misschien 10 of 20 duizend mensen in Afrika, ongeveer 100 duizend jaar geleden. Die kleine populatie had niet veel genetische variatie. En wat er gebeurde was, het was succesvol. Het vermenigvuldigde zich over de hele wereld, maar in die tijd is er relatief weinig nieuwe genetische variatie opgebouwd. En dus hebben we vandaag op onze planeet ongeveer dezelfde genetische variatie waarmee we Afrika uitliepen.

ROBERT KRULWICH: Dus mensen lijken ongelooflijk veel op elkaar. Maar niet alleen dat. Het blijkt dat we ook veel genen delen. goed. alles.

Vijftig procent van de genen in een banaan zit in ons?

ERIK LANDER: Hoe anders ben jij dan een banaan?

ROBERT KRULWICH: Ik voel. en ik voel dat ik dit met enige autoriteit kan zeggen. heel anders dan een banaan.

ERIK LANDER: Misschien voel je je anders dan een banaan.

ROBERT KRULWICH: Ik eet een banaan, maar dat heb ik nog nooit gedaan.

ERIK LANDER: Kijk, je hebt cellen, je moet die cellen laten delen. Alle machines om je DNA te repliceren, alle machines om de celcyclus te controleren, het celoppervlak, voor het maken van voedingsstoffen, en dat is hetzelfde in jou en een banaan.

Diep van binnen werden de fundamentele mechanismen van het leven maar één keer op deze planeet uitgewerkt, en ze zijn in elk organisme opnieuw gebruikt. Hoe dichter en dichter je bij een cel komt, hoe meer je een zak ziet met spullen erin en een kern, en de meeste van die basisfuncties zijn hetzelfde. Evolutie gaat niet iets opnieuw uitvinden als het niet hoeft.

Neem bakkersgist. Bakkersgist waar we anderhalf miljard jaar geleden mee te maken hebben gehad. Maar zelfs na anderhalf miljard jaar evolutionaire scheiding zijn de onderdelen voor veel van deze genen nog steeds uitwisselbaar.

ROBERT KRULWICH: Betekent dat nu? Ik wil gewoon zeker weten of ik dit goed begrijp. Betekent dat als je door die dingen kijkt dat alle C's en de A's en de T's en de T's en de G's. zie je exact dezelfde letterreeksen in exact dezelfde uitlijning? Als je naar de gist kijkt en je kijkt naar de persoon, is het dan C-C-A-T-T-T?

ERIK LANDER: Soms. Het is griezelig. De gensequentie is bijna identiek. Er zijn enkele genen, zoals ubiquitine, die voor 97 procent identiek zijn tussen mens en gist, zelfs na een miljard jaar evolutie.

ROBERT KRULWICH: Nou, met zo'n naam moet het wel zo zijn.

ERIK LANDER: Nou, ja, maar je moet begrijpen dat we diep van binnen heel erg deelnemen aan dezelfde trukendoos die de evolutie heeft gebruikt om organismen over deze hele planeet te maken.

ROBERT KRULWICH: Het lijkt ongelooflijk, maar al deze informatie over evolutie, over onze relatie met elkaar en met alle levende wezens, het is allemaal goed hier in deze monotone stroom van brieven. En naarmate het Human Genome Project vorderde en een hogere versnelling bereikte, nam het tempo van de ontdekkingen toe. Toen ze eenmaal volledig geautomatiseerd waren, duurde het niet lang voordat Lander en Collins en alle andere openbare projectteams reden hadden om feest te vieren.

FRANCIS COLLINS: Ik ben Francis Collins, de directeur van het National Human Genome Research Institute en we zijn blij om hier samen te zijn voor een feestje vandaag.

ROBERT KRULWICH: In november 1999 hadden ze een belangrijke mijlpaal bereikt. Tijdens een vijfvoudige prijsuitreiking, aangesloten via satelliet, kondigden de grote universiteitsteams aan dat ze klaar waren met een miljard basenparen DNA, een derde van het totale genoom.

ERIK LANDER: Hebben we iedereen? Ik wil graag een toost uitbrengen. Een miljard basenparen, allemaal op het openbare internet, beschikbaar voor iedereen ter wereld. Het is een ongelooflijke prestatie. Het is niet helemaal pijnloos geweest. En omdat ik weet dat iedereen in deze kamer leeft en ademt en elk moment van de dag nadenkt over hoe dit allemaal te laten gebeuren, hoe we de volledige schaal kunnen bereiken, wil ik er zeker van zijn dat je beseft wat een opmerkelijk iets we hebben gedaan. Ik hoop dat u ook weet dat dit geschiedenis is. Wat je ook doet in je leven, je maakt deel uit van de geschiedenis. We maken deel uit van een geweldige inspanning van de kant van de wereld om dit te produceren. En dit zal niet zijn zoals de maan, waar we af en toe een bezoek aan brengen. Dit zal iets zijn dat elke student, elke dokter elke dag zal gebruiken in de volgende eeuw en de eeuw daarna. Het is iets om je kinderen over te vertellen. Iets om je kleinkinderen over te vertellen. Het is iets waar jullie allemaal enorm trots op moeten zijn. En ik ben enorm trots op je. Een toast op deze opmerkelijke groep, op het werk dat we hebben gedaan, op het werk dat voor ons ligt. Hoor, hoor.

ROBERT KRULWICH: Iedereen hier hoopt dat het Genome Project zal helpen ziekten te genezen, en hoe eerder het klaar is, hoe beter voor ons allemaal. Maar er is iets meer dan idealisme, meer dan zelfs trots dat deze race om het genoom af te maken drijft. En dat is de wetenschap dat met de dag die voorbijgaat steeds meer stukjes van ons genoom via het US Patent Office in privébezit worden veranderd.

PATENT OFFICE PERSONEEL: Ik zeg een eigendom.

ROBERT KRULWICH: Het kantoor wordt overspoeld met aanvragen voor patenten voor elke denkbare uitvinding, van Star Wars-actiefiguren tot straalmotoren. En hier, samen met al die gadgets, zijn aanvragen voor patenten voor menselijke genen, dingen die van nature in ieder van ons bestaan. Hoe is dit mogelijk?

TODD ​​DICKINSON (Voormalig directeur, US Patent Office): We beschouwen genen als een octrooieerbaar onderwerp, zoals we bijna elke chemische stof beschouwen. We hebben patenten verleend op een aantal verbindingen, een aantal samenstellingen die in het menselijk lichaam voorkomen. Het gen dat codeert voor insuline is bijvoorbeeld gepatenteerd. En dat wordt nu gebruikt om bijna alle insuline te maken die wordt gemaakt, zodat mensenlevens tegenwoordig worden gered. Het leven van diabetici is beter.

Als we elke chemische stof die in het menselijk lichaam wordt aangetroffen, zouden uitsluiten, zouden er trouwens ontzettend veel uitvindingen zijn die niet beschermd zouden kunnen worden.

ROBERT KRULWICH: Over het algemeen moet u, om een ​​uitvinding te patenteren, bewijzen dat deze nieuw en nuttig is. Maar een paar jaar geleden zeiden critici dat het octrooibureau niet hard genoeg was. Dus sollicitanten zouden zeggen: "Nou, hier is een gloednieuwe reeks van As, C's, T's en G's rechtstreeks uit onze machines. Dat is nieuw. Nu nuttig? Waar zouden ze voor worden gebruikt? "Nou, ze waren nogal vaag over het gebruik", zegt Eric Lander.

ERIK LANDER: Het soort ding dat mensen toen deden, was dat ze zeiden: "Het zou kunnen worden gebruikt als een sonde om zichzelf te detecteren." Het is een triviaal gebruik. Ik bedoel, het is alsof je zegt: "Ik zou dit nieuwe eiwit kunnen gebruiken om pinda's te verpakken om in een doos te stoppen." Ik bedoel, het is waar. Het neemt ruimte in beslag.

ROBERT KRULWICH: Zou de octrooionderzoeker niet zeggen: "Dat is niet handig."

ERIK LANDER: Nee nee nee. U ziet dat de octrooirichtlijnen erg onduidelijk zijn. Ik heb er geen bezwaar tegen om iemand dat beperkte monopolie te geven als ze echt een remedie voor een ziekte hebben uitgevonden, een heel belangrijke therapie. Ik heb er bezwaar tegen om een ​​monopolie te geven als iemand gewoon een paar honderd letters van een gen heeft beschreven, geen idee heeft wat voor nut je zou kunnen hebben in de geneeskunde. Want wat er gaat gebeuren, is dat je dat kostbare monopolie hebt weggegeven aan iemand die een beetje werk heeft verzet. En dan de mensen die mee willen gaan en veel werk willen doen om er een therapie van te maken, nou, ze moeten de persoon gaan betalen die het al bezit. Ik vind het een slechte deal voor de samenleving.

ROBERT KRULWICH: Het duurt minstens twee jaar voordat het octrooibureau een enkele aanvraag verwerkt, dus op dit moment wachten er ongeveer 20.000 genetische octrooien op goedkeuring. Ze zijn allemaal in het ongewisse.

Dit kan problemen veroorzaken voor farmaceutische bedrijven die proberen te werken met genen om ziekten te genezen.Ik ben een bedrijf dat aan deze, deze en deze trede van de ladder probeert te werken, omdat ik denk dat ik hier misschien een geneesmiddel voor kanker kan ontwikkelen, gewoon omwille van het argument. Maar natuurlijk moet ik me zorgen maken dat iemand deze ruimte bezit.

ERIK LANDER: Je moet je veel zorgen maken dat deze regio hier, waar je aan werkt, die kanker zou kunnen genezen, al door iemand anders gepatenteerd is en dat octrooiaanvragen niet openbaar zijn. En dus leef je met de schaduw dat al je werk voor niets kan zijn.

ROBERT KRULWICH: Want op een dag gaat de telefoon en zegt: "Sorry dat je hier niet kunt werken. Ga van mijn territorium af."

ROBERT KRULWICH: Of: "Je kunt hier werken, maar ik ga je 100.000 dollar per week in rekening brengen." Of "Je kunt hier werken en ik reken je een stuiver aan, maar ik wil 50 procent van wat je ontdekt of iets ervan."

ERIK LANDER: En het probleem hier is. het is nog erger omdat veel bedrijven niet met het werk beginnen als er een wolk is over wie wat bezit. Als er onzekerheid is. bedrijven werken liever ergens waar ze geen onzekerheid hebben. En daarom denk ik dat het werk niet gedaan wordt vanwege de verwarring over wie de eigenaar is van spullen.

ROBERT KRULWICH: Voorstanders van patenten zeggen dat ze een cruciale stimulans zijn voor farmaceutische bedrijven. Geneesmiddelenonderzoek is fenomenaal duur, maar als een bedrijf een grote ontdekking kan monopoliseren met een patent, kan het honderden miljoenen dollars verdienen.

Onderzoekswetenschappers bevinden zich plotseling in een onbekende wereld die wordt geregeerd door het grote geld.

SHELDON KRIMSKY (analist wetenschapsbeleid, Tufts University): Elke wetenschapper die onderzoek doet, wordt nu gezien als een generator van rijkdom, zelfs als die persoon er niet in geïnteresseerd is. Als ze wat DNA sequencen, kan dat octrooieerbaar materiaal zijn. Dus of de wetenschapper het nu leuk vindt of niet, hij of zij wordt ondernemer alleen al door wetenschap te bedrijven.

ROBERT KRULWICH: Craig Venter is eerst een wetenschapper, maar hij heeft de sprong gemaakt van de academische wereld naar het bedrijfsleven. Laat me het hebben over de zaken hiervan. Beschouw je jezelf als een zakenman?

J. CRAIG VENTER: Nee. Om de een of andere reden erger ik me nog steeds aan de term. Maar mijn filosofie is dat we in dit land helemaal geen medische doorbraken zouden krijgen als het niet in een zakelijke omgeving was gedaan. We zouden geen nieuwe therapieën hebben als we geen biotechnologische en farmaceutische industrie hadden.

ROBERT KRULWICH: Maar zijn ze. als je uitsteekt tegen het woord zakenman, kan dat zijn omdat je in een deel van je ziel misschien denkt dat de wetenschap en de zakenwereld fundamenteel onverenigbaar zijn om een ​​simpele reden & mdash dat het bedrijf iets moet verkopen en de wetenschap moet iets leren of leren.

J. CRAIG VENTER: Ik denk dat ik er tegenaan loop omdat het wordt gebruikt als een aanval, als kritiek. In dit geval, als de wetenschap niet spectaculair is, als het medicijn niet spectaculair is, zal er geen winst zijn.

ROBERT KRULWICH: Venter kreeg driehonderd miljoen dollar om Celera op te richten en zijn investeerders verwachten daar iets voor terug. Maar hoe kunnen ze profiteren van het genoom?

Op dit moment rekent het bedrijf op pure computerkracht. Dit is Celera's Master Control. Vierentwintig uur per dag houden technici alle belangrijke activiteiten van het bedrijf in de gaten, inclusief de honderden sequencers die voortdurend onze genen decoderen.

En ze houden toezicht op Celera's belangrijkste bron van inkomsten, een enorme website waar je tegen betaling verschillende genomen kunt verkennen, waaronder die van fruitvliegen, muizen en natuurlijk mensen. Wat dit allemaal oplevert, is zoiets als een grote browser, een gebruiksvriendelijke interface tussen jou en je genen.

TONY WHITE (CEO, Applera Corporation): Het is onze taak om producten te verkopen die onderzoek mogelijk maken. Dat is in wezen wat we doen. Dus we zijn gewend om de houwelen en de schoppen aan de mijnwerkers te verkopen. Hulpmiddelen om het menselijk genoom en andere verwante soorten te interpreteren zijn slechts meer producten in hetzelfde genre. Ze zijn gewoon minder tastbaar dan een machine.

ROBERT KRULWICH: Het bedrijfsplan van Celera is dus om informatie te verzamelen van allerlei soorten wezens, deze samen te stellen en hun bevindingen te verkopen aan farmaceutische bedrijven of universiteiten of wie dan ook. Maar het is het verkopende deel, het verkopen van wetenschappelijke informatie, dat sommige wetenschappers erg ongemakkelijk maakt.

SHELDON KRIMSKY: Dit is een grote verandering in het ethos van de wetenschappelijke gemeenschap, wat zogenaamd is. het was gebaseerd op het idee van gemeenschapswaarden van vrije en open uitwisseling van informatie. Het fundamentele idee dat wanneer je iets leert, je het onmiddellijk publiceert, je het deelt met anderen. Wetenschap groeit door dit gemeenschapsbelang van gedeelde kennis.

TONY WIT: Ik denk: "Waarom geeft Pfizer hun medicijnen niet weg? Ze zouden veel meer mensen kunnen helpen als ze er niets voor zouden vragen."

MEDEWERKER VAN CELERA: Op welk punt is gratis echt gratis?

ROBERT KRULWICH: Tony White heeft er absoluut geen probleem mee om geld te verdienen met het menselijk genoom.

TONY WIT: Ik hoop dat we een wettelijk monopolie hebben op de informatie. Ik hoop dat ons product zo goed is, en zo waardevol voor mensen, dat ze het nodig vinden om via ons te komen om het te krijgen.

Iedereen die wil, kan alle tools bouwen die we gaan bouwen. Of ze er wel of niet voor kiezen, is een andere zaak.

ROBERT KRULWICH: Nu, wat is de betere zaak om in te zijn, denkt u, de zaak van de verhuurder, of deze: "U schrijft zich in en ik zal u wat informatie geven over alles wat u maar wilt", zaken?

ERIK LANDER: Het zijn allebei waardeloze bedrijven.

ROBERT KRULWICH: Ze zijn slecht?

ERIK LANDER: Het zijn waardeloze bedrijven in vergelijking met de echte business. Geneesmiddelen maken. Eigenlijk moleculen maken die mensen genezen.

ROBERT KRULWICH: Mensen genezen is het hele punt, toch?

Maar als er één ding is dat het Human Genome Project ons heeft geleerd, dan is het dat het vinden van genezing een stuk moeilijker is dan alleen letters van DNA te lezen.

Neem bijvoorbeeld het geval van de kleine Riley Demanche. Met twee maanden lijkt Riley een perfect gezond jongetje te zijn. Maar dat is hij niet. Toen Riley slechts 13 dagen oud was, kreeg Kathy Demanche het telefoontje waar elke ouder bang voor is.

KATHY DEMANCHE (Moeder van een zoon met cystische fibrose): Mijn kinderarts belde op een donderdagavond en hij zei: "Ik moet met je praten over de baby." Hij zei: "Ga je zitten?" En ik heb zoiets van, "Ja." En dat verbaasde me echt. En hij zei: "Houd je de baby vast?" Omdat hij natuurlijk niet wilde dat ik de baby liet vallen. En hij zei: "De tests zijn doorgekomen en Riley testte positief op cystische fibrose."

ROBERT KRULWICH: Zoals Kathy en haar man snel zouden leren, tast cystische fibrose, kortweg CF, verschillende organen van het lichaam aan, maar vooral de longen. De slachtoffers lijden aan chronische luchtweginfecties. De helft van alle CF-patiënten overlijdt voor de leeftijd van 30 jaar.

DAVID WALTZ (Kinderziekenhuis, Boston): Klinkt goed.

DAVID WALTZ: Ik denk dat we hoopvol mogen zijn dat hun kind zal opgroeien met een normaal en gezond, gelukkig en lang leven. Maar op dit moment heb ik daar geen garanties over.

KATHY DEMANCHE: Iemand had me gevraagd: "Ben je bereid om je zoon op zo'n jonge leeftijd te begraven? Of het nu vier of veertig is?" En hij was 17 dagen oud toen dat gebeurde. En ik zei: "Ik heb hem 17 dagen gehad. Ik zou die 17 dagen niet willen ruilen."

ROBERT KRULWICH: Het vinden van het genetische defect dat CF veroorzaakt, was groot nieuws in 1989.

BAND VAN NIEUWSANKER: Medische onderzoekers zeggen dat ze het gen hebben ontdekt dat verantwoordelijk is voor cystische fibrose, de meest voorkomende erfelijke dodelijke ziekte in dit land.

TAPE VAN ROBERT DRESSING: We gaan deze ziekte genezen.

ROBERT KRULWICH: Veel mensen verwachtten dat de remedie elke dag zou arriveren. Het deed het niet.

Francis Collins, nu hoofd van het Genome Project van de overheid, leidde een van de teams die het CF-gen ontdekten.

FRANCIS COLLINS: We hebben nog steeds niet gezien dat deze ziekte genezen is of zelfs maar bijzonder geprofiteerd heeft van al deze prachtige moleculaire biologie. CF wordt nog steeds behandeld zoals het 10 jaar geleden was. Maar dat gaat veranderen.

ROBERT KRULWICH: De oorspronkelijke hoop was dat baby's zoals Riley konden worden genezen door gentherapie, een medicijn dat een goed werkende kopie van een gebroken gen zou kunnen opleveren. Maar pogingen tot gentherapie hebben bijna nooit gewerkt. Ze blijven zeer controversieel. Dus als er een effectieve behandeling voor Riley komt, in plaats van zijn genen te repareren, gaan we een kijkje nemen en dit is nieuw terrein en zijn eiwitten.

ROBERT KRULWICH: Wat doen eiwitten?

J. CRAIG VENTER: Als je naar jezelf in de spiegel kijkt, zie je geen DNA. Je ziet geen RNA. Je ziet eiwitten en het resultaat van eiwitactie. Dus dat is waar we fysiek uit bestaan.

ROBERT KRULWICH: Het is dus niet iets van Rogers en Hammerstein, waarbij de ene man het deuntje doet en de andere de tekst. Is dit een geval waarin de genen de eiwitten maken en de eiwitten ons?

J. CRAIG VENTER: Klopt. Wij zijn de accumulatie van onze eiwitten en eiwitactiviteiten.

ROBERT KRULWICH: Een eiwit begint als een lange keten van verschillende chemicaliën, aminozuren. Maar in tegenstelling tot genen werken eiwitten niet in een rechte lijn.

FRANCIS COLLINS: Genen zijn in feite eendimensionaal. Als je de volgorde van A, C, G en T opschrijft, is dat wat je moet weten over dat gen. Maar eiwitten zijn driedimensionaal. Dat moet wel, want we zijn driedimensionaal en we zijn gemaakt van die eiwitten. Anders zouden we allemaal lineaire, onvoorstelbaar rare wezens zijn.

ROBERT KRULWICH: Hier is een deel van een eiwit. Zie ze als klitten van lint. Ze komen in een aantal verschillende vormen. Ze kunnen er zo uitzien. Of zoals dit. Of dit. De variëteiten zijn eindeloos.

Maar wanneer het is gemaakt, krijgt elk eiwit te horen: "Hier is je vorm." En die vorm bepaalt wat het doet, vertelt alle andere eiwitten wat het doet. En zo herkennen ze elkaar als ze aanhaken en zaken doen. In de eiwitwereld is je vorm je lot.

FRANCIS COLLINS: Ze hebben behoeften en redenen om op een bepaalde manier tegen elkaar aan geknuffeld te willen worden. En eigenlijk zal een bepaalde aminozuursequentie bijna altijd op een precieze manier vouwen.

ROBERT KRULWICH: Moet ik origami-achtig denken? Ik bedoel, moet ik denken aan folden en dan.

FRANCIS COLLINS: Het is heel elegant, heel ingewikkeld. En we hebben nog steeds niet de mogelijkheid om precies te voorspellen hoe dat gaat werken. Maar het werkt natuurlijk wel.

ROBERT KRULWICH: Behalve natuurlijk als er iets misgaat. En dat is wat er gebeurde met baby Riley. Riley heeft een klein foutje in zijn DNA. Slechts drie letters van de drie miljard ontbreken. Maar door die fout heeft hij een defect gen. En dat defecte gen creëert een defect of misvormd eiwit. En slechts de kleinste kleine veranderingen in vorm en giek. De gevolgen zijn enorm.

Omdat het nu misvormd is, en een sleuteleiwit dat in longcellen wordt gevonden, in feite in veel cellen, zijn werk niet kan doen.

Laten we eens kijken naar enkele echte longcellen. We reizen naar binnen.

Dit is de voering, of het membraan, van een longcel en hier is hoe het eiwit zou moeten werken. De bovenkant van je scherm is de buitenkant van een cel, de onderkant van het scherm, de binnenkant van de cel natuurlijk. En ons gezonde eiwit zorgt voor een soort stortkoker zodat zout de cel in en uit kan. Die kleine groene belletjes, dat is zout. En zoals je hier ziet, dringt het zout door.

Maar als het eiwit niet de juiste vorm heeft, mag het niet in het membraan. Het kan zijn werk niet doen. En zonder dat eiwit, zoals je hier ziet, komt zout vast te zitten in de cel. En dat veroorzaakt een hele reeks reacties waardoor het celoppervlak plakkerig wordt en bedekt wordt met dik slijm. Dat slijm moet fysiek worden losgemaakt.

De familie van Riley leert het slijm dat zich in zijn longen kan ontwikkelen los te maken en infecties te bestrijden met antibiotica. Maar wat de dokters en de wetenschappers graag zouden doen, is dat als ze de genen van baby Riley niet kunnen repareren, er misschien een manier is om Riley's misvormde eiwit te behandelen en de oorspronkelijke vorm te herstellen. Want als je ze maar de juiste vorm zou kunnen geven, zouden de eiwitten onmiddellijk herkenbaar moeten worden voor andere eiwitten en weer aan het werk moeten.

Maar kijk naar deze dingen. Hoe zouden we ooit kunnen leren om wild, multidimensionale eiwitten op de juiste manier te vouwen? Het is misschien te doen, maar het zal niet gemakkelijk zijn.

ERIK LANDER: Het genoomproject was een fluitje van een cent in vergelijking met de meeste andere dingen, omdat genetische informatie lineair is. Het gaat in een eenvoudige lijn op en neer door het chromosoom. Als je eenmaal begint te praten over de driedimensionale vormen waarin eiwitketens zich kunnen vouwen en hoe ze op veel verschillende manieren aan elkaar kunnen kleven om dingen te doen, of de manieren waarop cellen kunnen interageren, zoals bedrading in je hersenen, dan zit niet meer in een eendimensionaal probleem. Je bent niet meer in Kansas.

ROBERT KRULWICH: En terwijl wetenschappers de wereld van eiwitten betreden, kijken ze heel nauwkeurig naar patiënten als Tony Ramos.

Tony heeft cystische fibrose, maar het is niet het typische geval. CF ontwikkelt zich bijna altijd in de vroege kinderjaren. Tony had geen symptomen tot ze 15 was.

TONY RAMOS (Patiënt met taaislijmziekte): Ik begon te hoesten. En toen bleven we maar denken dat ik veel verkouden was. En mijn stiefmoeder dacht: "Dat klopt niet." Dus ging ik naar dokters om erachter te komen en onderging veel tests omdat ik niet aan het profiel voldeed. Tuberculose, wandelende longontsteking, je weet wel, test na test.

ROBERT KRULWICH: Op het moment van haar diagnose kreeg Tony's familie te horen dat ze misschien niet na haar eenentwintigste verjaardag zou overleven. Ze is nu halverwege de veertig, maar haar CF verslechtert. Twee of drie keer per jaar moet ze wel in het ziekenhuis worden opgenomen om haar longen te reinigen.

TONY RAMOS: Ze deden altijd een beetje funky onderzoek om de zaak te helpen, omdat we niet de normale zijn. je weet wel. er zijn niet veel van ons. Ik weet dat ze niet weten waarom. En het is het grote vraagteken. En hopelijk blijft onderzoek het uitwijzen.

ROBERT KRULWICH: Hier is de vraag. Tony werd geboren met een fout in hetzelfde gen als baby Riley, en toch, om de een of andere reden, toen Tony een baby was, werd ze niet ziek. Waarom? En nu ze ziek is, is ze niet gestorven. Waarom? Wat heeft Tony dat de andere CF-patiënten niet hebben?

Dr. Craig Gerard gelooft dat het antwoord in haar genen ligt, in haar DNA.

CRAIG GERARD (Kinderziekenhuis, Boston): Geen enkel gen werkt geïsoleerd. Het is altijd een onderdeel van een groter geheel. En er kunnen dus andere genen zijn die compenseren.

ROBERT KRULWICH: Zou het kunnen dat Tony andere genetische mutaties heeft, goede mutaties die goede eiwitten produceren die haar 15 jaar gezond hebben gehouden? Dat houdt haar nu in leven?

CRAIG GERARD: Naar mijn mening zijn er genen die haar in staat stellen een gunstiger verloop te hebben, als je wilt, dan een andere patiënt.

ROBERT KRULWICH: Dr. Gerard is op zoek naar het speciale ingrediënt in Tony. Als blijkt dat ze een of twee goede eiwitten heeft die haar helpen, kunnen we ze misschien in een fles doen en ze gebruiken om alle CF-patiënten zoals baby Riley te helpen.

Niemand kan de toekomst van Riley voorspellen, of in hoeverre CF zijn leven zal beïnvloeden. Maar nu we de kaart van onze genen hebben, kunnen we de volgende grote stap zetten.

Want wat genen eigenlijk doen, is dat ze eiwitten maken.

Ik krijg het gevoel dat iedereen uit de genenbusiness stapt en plotseling een nieuwe business ingaat waar ik over hoor, de eiwitbusiness. Er is zelfs een nieuwe naam, in plaats van genoom, ik hoor deze andere naam.

ROBERT KRULWICH: Het proteoom. Wat is dat?

ERIK LANDER: Welnu, het genoom is de verzameling van al je genen en DNA. Het proteoom is de verzameling van al je eiwitten. Kijk, wat er gebeurt, is dat we ons realiseren dat als we het leven willen begrijpen, we systematisch onderaan moeten beginnen en alle bouwstenen moeten pakken. De eerste bouwstenen zijn de DNA-letters. Hieruit kunnen we de genen afleiden. Uit de genen kunnen we de eiwitproducten afleiden die ze maken en die al het werk van je cel doen. Dan moeten we begrijpen wat elk van die eiwitten doet, wat hun vorm is, hoe ze met elkaar omgaan, en hoe ze circuits en verbindingen met elkaar maken. Dus in zekere zin is dit nog maar het begin van een zeer uitgebreid, systematisch programma om alle componenten te begrijpen en hoe ze allemaal met elkaar verbonden zijn.

ROBERT KRULWICH: Alle componenten en hoe ze aansluiten? Maar hoeveel componenten zijn er? Hoeveel genen en hoeveel eiwitten hebben we?

ERIK LANDER: De echte schok over de genoomsequentie was dat we zoveel minder genen hebben dan we onze studenten hebben geleerd. Het officiële leerboekantwoord is: "De mens heeft 100.000 genen." Dat weet iedereen al sinds het begin van de jaren tachtig. Het enige probleem is dat het niet waar is. Het blijkt dat we maar 30.000 genen hebben.

ROBERT KRULWICH: Dertigduizend genen? Dat is het? Niet iedereen is het met dit aantal eens, maar dat zijn er ongeveer net zoveel als een muis! Zelfs een fruitvlieg heeft 14.000 genen.

ERIK LANDER: Dat is echt vervelend voor veel mensen, dat we maar ongeveer twee keer zoveel genen hebben als een fruitvlieg, omdat we onszelf graag zien als veel meer dan twee keer zo complex.

ROBERT KRULWICH: Nou, jij niet?

ERIK LANDER: Ik vind het natuurlijk leuk om zo over mezelf te denken. En dus roept het twee vragen op. Zijn we echt complexer?

ROBERT KRULWICH: Jij laat me de fruitvlieg zien die kan componeren als Mozart, en dan doe ik dat natuurlijk.

ERIK LANDER: Ja, nou, laat me de mens zien die kan vliegen, toch? Dus?

ROBERT KRULWICH: Okee.

ERIK LANDER: We hebben allemaal onze talenten, toch?

ROBERT KRULWICH: Ik veronderstel dat we dat doen. Maar toevallig hebben we veel genen die vrijwel identiek zijn in ons en fruitvliegen. Maar gelukkig lijken onze genen meer te doen.

Dus laten we zeggen dat ik een fruitvlieg ben. Een van mijn fruitvlieggenen kan één en twee enigszins verschillende eiwitten maken. Maar nu ben ik een mens en kan hetzelfde gen in mij één, twee, drie, vier verschillende eiwitten maken. En dan zouden deze vier eiwitten kunnen combineren en nog grotere en meer eiwitten kunnen bouwen.

ERIK LANDER: Het blijkt dat het gen een boodschap maakt, maar de boodschap kan op verschillende manieren gesplitst worden. En dus kan een gen drie of vier eiwitten maken, en dan kan dat eiwit gemodificeerd worden. Er kunnen andere eiwitten zijn die er een fosfaatgroep op plakken, of twee fosfaatgroepen. En in feite zouden al deze aanpassingen aan de eiwitten ervoor kunnen zorgen dat ze anders gaan functioneren. Dus hoewel je misschien maar 30.000 genen hebt, zou je 100.000 verschillende eiwitten kunnen hebben.En als je klaar bent met het aanbrengen van alle verschillende aanpassingen, zijn het er misschien wel een miljoen. Enge gedachte.

ROBERT KRULWICH: Dus, beginnend met dezelfde grondstoffen, zegt de fruitvlieg, "hm, phht, hm, phht, hm, phht", maar de mens kan, door op de een of andere manier in staat te zijn alle onderdelen op veel verschillende manieren te rangschikken, produceren melodieën misschien.

ERIK LANDER: Ja. Al zijn we nog niet zo goed in het horen van de melodieën. Wij kunnen. een van de opwindende dingen bij het lezen van de genoomsequentie is dat we een glimp opvangen van die complexiteit van de delen, en hoe het een symfonie is in plaats van een eenvoudig deuntje. Maar het is niet zo eenvoudig om alleen de bladmuziek daar te lezen en de symfonie te horen die eruit voortkomt.

ROBERT KRULWICH: Oké, dus het is niet alleen het aantal genen, het zijn alle verschillende eiwitten die ze kunnen maken en de manier waarop die eiwitten op elkaar inwerken. En om al die interacties te achterhalen en hoe ze gezondheid en ziekte beïnvloeden, dat zal wetenschappers de komende decennia erg druk houden.

Maar voordat het onderzoek serieus kan beginnen, moeten ze natuurlijk eerst de onderdelenlijst en de genen invullen.

En tegen het voorjaar van 2000 waren beide partijen en Celera en Celera in het hyperdrive-kamp en probeerden ze als eerste de finish te bereiken en alle drie miljard brieven te krijgen.

GEN MYERS (Vice-voorzitter, Informatica-onderzoek, Celera): Het tempo van de dingen en de omvang van de dingen was echt ongelooflijk. Ik bedoel, ik zou me herinneren dat ik binnenkwam en gewoon een heel aangrijpend gevoel in mijn buik had, ik bedoel gewoon een intens soort van, "Oh mijn God. Kan ik dit aan?"

ROBERT KOK-DEEGAN: Weet je, wie als eerste deze referentiesequentie van het menselijk genoom heeft, die zal beroemd worden. Ze zullen lange tijd op de voorpagina van de New York Times staan ​​en veel meer dan dat. Het worden, je weet wel, beroemdheden. En weet je, als dat gebeurt, is het niet onredelijk dat mensen naar die ster grijpen en proberen daar eerder te komen dan de andere persoon.

TONY WIT: Ik dacht dat de echt hevige concurrentie in deze wereld was tussen bedrijven met een winstoogmerk. Ik merk nu dat we pikers zijn in de zakenwereld, vergeleken met de academische concurrentie die er is. En ik begin te begrijpen waarom. Omdat hun valuta publicatie is. Hun valuta is attributie. En hun volgende financiering komt van hun laatste overwinning.

ROBERT KOK-DEEGAN: Ik denk dat we allemaal beter af zijn vanwege het feit dat er een competitie is. Wat je wilt is een systeem dat mensen in de war brengt en probeert iets sneller, beter en goedkoper te doen dan de volgende.

GEN MYERS: De omgeving bij Celera was echt intens en het deed me denken aan de finaleweek op Cal Tech. En er is een traditie bij Cal Tech dat op de allereerste dag van de finaleweek, De rit van de Walkuren wordt op volle toeren gespeeld. En dus dacht ik: "Nou, aangezien elke week voelt alsof het hier finaleweek is, waarom speel ik dan niet De rit, en kijk wat er gebeurt."

Dus we hebben een heleboel Vikinghoeden en uiteindelijk kopen we Nerf®-bogen, oké? Omdat we Noordse Valkyrianen zijn. En de volgende week schieten we op elkaar. En we zeggen: "Weet je, hier klopt iets niet aan." Dus besloten we de week daarop dat we raids zouden gaan organiseren en daarna enkele van de andere teams zouden overvallen.

Buiten het medeweten van ons hadden ze zich voorbereid. Ze hadden kleine mutsen. Oké, en hun eigen Nerf®-wapens. Toen begon de oorlog.

Het is gewoon een uitgave. Het is een manier om met de druk om te gaan, denk ik. We renden allemaal vijf of tien minuten als een gek rond, deden wat lichaamsbeweging en lachten wat. En dan zijn we klaar om er echt achteraan te gaan.

ROBERT KRULWICH: De Wagner lijkt te werken.

De output bij Celera gaat in een meedogenloos tempo door. Venter houdt vol dat de urgentie niet alleen voortkomt uit de wens om het overheidsproject te verslaan, maar ook uit de vaste overtuiging dat wat er uit deze machines komt en de A's, C's, T's en Gs&mdash een diepgaande impact zal hebben op ons hele leven.

J. CRAIG VENTER: Het is een nieuw begin in de wetenschap en totdat we al die gegevens hebben, kan dat niet echt plaatsvinden. Iedereen die kanker heeft, iedereen die een familielid heeft met een ernstige ziekte. deze gegevens en informatie bieden hen enorme hoop dat dingen in de toekomst kunnen veranderen.

ERIK LANDER: Als je in het verleden diabetes wilde uitleggen, moest je altijd je hoofd krabben en zeggen: "Nou, het kan iets anders zijn dat we nog nooit eerder hebben gezien." Maar wetende dat je de volledige onderdelenlijst hebt, verandert het biomedische onderzoek radicaal, omdat je niet met je hand kunt zwaaien en zeggen: "Het kan iets anders zijn." Er is niets anders.

ROBERT KRULWICH: In het verleden was het vinden van de genen die een ziekte veroorzaken een uiterst langzaam proces. Maar met het invullen van een lijst zou het veel makkelijker moeten zijn om een ​​direct verband te leggen tussen ziekte en gen.

Maar hoe? Laten we zeggen dat ik op zoek ben naar een gen dat iets veroorzaakt. we maken er mannelijke kaalheid van. Hoe zou ik dat aanpakken?

Nou, ik zou een stel kale jongens willen hebben.

Dus hier zijn drie kale mannen en nemen hun bloed en kijken naar hun DNA. Nu neem ik drie mannen met veel haar, en hier is hun DNA. En wat als de kale jongens hier allemaal een bepaalde spelling delen, op deze plek, die we de kale plek noemen. En op dezelfde plek zie je de harige mannen. jij ziet dat? Een andere schrijfwijze.

Dus is dit het gen dat kaalheid veroorzaakt? Misschien, maar waarschijnlijk niet. Dit kan toeval zijn

Dus, hoe verbeter ik mijn kansen om het specifieke spellingsverschil te vinden dat verband houdt met kaalheid? Het zou helpen als ik wist dat de kale mannen en de harige mannen echt hetzelfde DNA hadden, behalve de genen waarvan ik vermoed dat ze ze kaal of harig kunnen maken.

Waar vind ik jongens die heel erg op elkaar lijken, op een paar uitzonderingen na? Een gezin, toch? Als er bijvoorbeeld broers en vaders en zonen en neven waren, die veel genen delen. Dus laten we zeggen dat deze drie jongens broers zijn en een verbluffende gelijkenis echt in het gezicht. Maar merk op dat een van hen harig is en twee kaal.

Wat deze ook anders maakt, moet opvallen als je hun genen vergelijkt. En hetzelfde geldt voor deze jongens. Er is duidelijk een verschil in de foto's, maar dat verschil kan in de genen opduiken.

Je zou hetzelfde kunnen doen voor elke ziekte die je leuk vindt. Dus als ik het DNA van veel verwante mensen zou kunnen doorzoeken, en ik zou ontdekken dat sommigen van hen ziek zijn en sommigen gezond, zou ik een veel betere kans hebben om uit te zoeken welke genen erbij betrokken zijn.

Maar waar doe ik dit? Welnu, een plaats is een kleine eilandnatie in de Noord-Atlantische Oceaan, IJsland. In veel opzichten is IJsland de perfecte plek om te zoeken naar genen die ziekten veroorzaken. Het heeft een kleine populatie, slechts ongeveer 280.000 mensen, en vrijwel allemaal stammen ze af van de oorspronkelijke kolonisten en mdashVikingen die hier meer dan 1000 jaar geleden kwamen.

KARI STEFANSSON (Voorzitter, deCODE Genetics): Als u door dit land rijdt, zult u grote moeite hebben om enig bewijs te vinden van de dynamische cultuur die hier bijna 1100 jaar bestond. Er zijn geen grote gebouwen. Er zijn geen monumenten.

ROBERT KRULWICH: Maar één ding dat IJsland wel heeft, is een fantastisch geschreven geschiedenis, inclusief bijna ieders stamboom. En nu staat het allemaal in een gigantische database. Toets gewoon een burgerservicenummer in en daar zijn ze, al je voorouders, terug naar de oorspronkelijke Viking.

THORDUR KRISTJANSSON (deCODE Genetica): Dus wat we hier hebben is mijn voorouderboom. Ik ben hier aan de onderkant. Dit zijn mijn vader en moeder, mijn grootouders, overgrootouders, enzovoort. We kunnen een persoon vinden die een van de oorspronkelijke kolonisten van IJsland was. Hier hebben we Ketill Bjarnarson, genaamd Ketill Flatnefur, wat betekent dat hij een platte neus had, dus misschien heeft hij die gebroken tijdens een gevecht of zoiets. En we schatten dat hij rond het jaar 805 werd geboren.

ROBERT KRULWICH: Kari Stefansson is een door Harvard opgeleide wetenschapper die de potentiële goudmijn zag die verborgen zou kunnen zijn in de genetische geschiedenis van IJsland. Hij richtte een bedrijf op genaamd deCODE Genetics om eeuwenoude stambomen te combineren met de modernste DNA-analyse en computertechnologie, en om systematisch de genen op te sporen die ziekten veroorzaken.

KARI STEFANSON: Ons idee was om te proberen zoveel mogelijk gegevens over de gezondheidszorg samen te brengen, zoveel mogelijk gegevens over genetica en de genealogie, en eenvoudig de informatica-tools te gebruiken om ons te helpen nieuwe kennis te ontdekken, nieuwe manieren te ontdekken om te diagnosticeren, te behandelen en ziekten te voorkomen.

ROBERT KRULWICH: Een van de eerste projecten van deCODE was het zoeken naar de genen die artrose zouden kunnen veroorzaken. Regnheidir Magnusdottir had het grootste deel van haar leven de slopende ziekte.

(Vertaling van) REGNHEIDIR MAGNUSDOTTIR (Artritis patiënt): De eerste symptomen verschenen toen ik 12 was. En toen ik 14 was, deden mijn knieën erg pijn. Niemand besteedde er echt aandacht aan. Zo was het gewoon. Maar toen ik 39 was, had ik er genoeg van, dus ging ik naar een dokter.

ROBERT KRULWICH: Mevrouw Magnusdottir was nooit alleen in haar lijden. Ze is een van de 17 kinderen. Elf van hen waren zo getroffen door artritis dat hun heupen moesten worden vervangen. Dit was precies het soort gezin waar deCode naar op zoek was.

Ze lieten mevrouw Magnusdottir en andere leden van haar familie bloedmonsters doneren voor DNA-analyse. En om meer van haar familieleden te vinden, mensen die ze nog nooit had ontmoet, voerde deCode haar sofinummer in hun gigantische database in, en daar waren ze.

Maar wie van deze mensen heeft artritis? Om daar achter te komen, vroeg Stefansson de regering van IJsland om zijn bedrijf exclusieve toegang te geven tot de medische dossiers van het hele land. En in ruil daarvoor zou deCode een miljoen dollar per jaar betalen plus een deel van de winst. Op die manier kon deCODE alles in hun computers & mdashDNA, gezondheidsdossiers en stambomen koppelen.

KARI STEFANSSON: Dit idee was waarschijnlijk meer bediscussieerd dan enige andere kwestie in de geschiedenis van de Republiek. Aan de vooravond van de parlementaire stemming over het wetsvoorstel was er een opiniepeiling waaruit bleek dat 75 procent van degenen die een standpunt over de kwestie innamen de goedkeuring van het wetsvoorstel steunde, 25 procent was ertegen.

ROBERT KRULWICH: Onder die 25 procent die tegen het plan was, bevonden zich de meeste IJslandse artsen.

TOMAS ZOEGA (IJslandse medische vereniging): Ik voelde dat er iets fundamenteel mis was in dit alles, weet je? Ze weten alles over je, niet alleen over je medische geschiedenis, over je medische verleden, maar ze hebben nu je gen, het DNA. Ze weten over je toekomst, iets over je kinderen, over je familieleden.

BJORN GUNDMARSSON (Havmnar Gezondheidscentrum): We zijn verlamd omdat we eigenlijk niets kunnen doen, want degene die de verantwoordelijkheid neemt, is het management van het gezondheidscentrum. Als ze deze informatie uit de medische dossiers weggeven, krijgen ze geld. En iedereen heeft geld nodig. De zorg heeft echt geld nodig.

ROBERT KRULWICH: Dus wat is hier echt het probleem? Laten we een hypothetisch voorbeeld nemen. Ik ga dit allemaal goedmaken. Laten we doen alsof dit medische dossiers zijn van een gemiddeld persoon. En we veronderstellen dat ik hier een hiv-test zie, en dan is hier medicatie tegen angst na wat een rommelige scheiding lijkt te zijn, en hier een ouder die stierf aan de ziekte van Alzheimer.

Dit zijn allemaal dingen die iedereen kunnen overkomen, maar wil je het allemaal in een centrale computerbank? En wil je het in dezelfde computer koppelen aan al je familieleden en aan je eigen persoonlijke DNA-bestand? En zou iemand het recht moeten hebben om op visexpeditie te gaan door je medische geschiedenis en je DNA?

Nou, het kan beangstigend zijn, maar het kan ook werken. deCODE beweert dat het verschillende genen heeft ontdekt die kunnen bijdragen aan artrose. Dus deze benadering, het combineren van stambomen, medische dossiers en DNA, zou kunnen leiden tot betere medicijnen of tot genezing van een hele reeks ziekten.

KARI STEFANSSON: Om alle gegevens op één plek te hebben, zodat u de moderne informatica-apparatuur kunt gebruiken om de stukjes en beetjes gegevens naast elkaar te plaatsen en op zoek te gaan naar de beste pasvorm, is een absoluut fascinerende mogelijkheid.

ROBERT KRULWICH: Stefansson zegt dat niemand hiertoe wordt gedwongen en dat er uitgebreide privacybeschermingen zijn: er worden geen namen gebruikt en burgerservicenummers worden gecodeerd. Hij stelt ook dat het DNA-gedeelte van de database vrijwillig is.

KARI STEFANSSON: De zorgdatabase bevat alleen zorginformatie. We kunnen er een kruisverwijzing naar maken met DNA-informatie, maar alleen van die personen die ons bloed hebben willen geven, waardoor we DNA kunnen isoleren, het genotyperen en er een kruisverwijzing naar maken met de database. Alleen van degenen die dat risico bewust hebben genomen. Dus het wordt niemand opgelegd, en niemand die er bang voor is, niemand die er echt bang voor is, zou ons bloed moeten komen geven.

ROBERT KRULWICH: Over de hele wereld duiken DNA-databases op, ook in de VS. Ze hebben allemaal regels voor de bescherming van de privacy, maar ze maken ethici nog steeds nerveus.

GEORGE ANNAS (De Universiteit van Boston): Ik gebruik graag de analogie van het DNA-molecuul met een toekomstig dagboek en er zit veel informatie in een DNA-molecuul. De reden dat ik het een dagboek noem, een toekomstig dagboek, is omdat ik denk dat het zo privé is. Ik denk dat niemand je toekomstige dagboek zou moeten kunnen openen, behalve jij.

ROBERT KRULWICH: Een nogal somber beeld van waar dit allemaal toe zou kunnen leiden, wordt gepresenteerd in de Hollywood-film 'Gattaca'. Dit is een wereld waar ieders DNA, ieders toekomstige dagboek, een open boek is. Iedereen die het zich kan veroorloven, laat zijn kinderen op maat maken. Maar wat gebeurt er met de arme slons die op de ouderwetse manier is verwekt?

GATTAC-VOICEOVER: "Ik zal nooit begrijpen wat mijn moeder bezielde om haar geloof in Gods handen te leggen in plaats van die van haar plaatselijke geneticus. Tien vingers, tien tenen, dat was vroeger het enige dat ertoe deed. Niet nu. Nu, slechts enkele seconden oud, de exacte tijd en de oorzaak van mijn dood was al bekend."

GATTCA VERPLEEGSTER: "Neurologische aandoening, 60 procent kans op aandachtstekortstoornis, 89 procent kans op hartaandoening, 99 procent kans op levensverwachting, 30,2 jaar."

ROBERT KRULWICH: Dertig komma twee jaar. De verpleegster lijkt precies te weten wat er met deze baby gaat gebeuren. Wat is belachelijk, toch? Nooit gebeurt. Of is het mogelijk dat we op een dag met verontrustende helderheid in onze toekomst kunnen kijken? Tien, twintig, zelfs zeventig jaar vooruit?

GEORGE ANNA: Dat is een mogelijke toekomst en waar dit zo routine wordt dat bij de geboorte iedereen een profiel krijgt. Het gaat rechtstreeks naar hun medisch dossier. Eén exemplaar gaat naar de FBI, dus we hebben een identificatiesysteem voor alle mogelijke misdaden in de Verenigde Staten. Eén exemplaar gaat. waar? Naar de basisschool? Naar de middelbare school? Naar de hogeschool? Naar de werkgever? Naar het leger? Zoals, een verschrikkelijke toekomst. Al moet ik zeggen dat er velen in de biotech-industrie en de medische wereld zijn die dat een geweldige toekomst vinden.

ROBERT KRULWICH: In feite bestaat veel van de technologie al, nu, vandaag.

Deze jongens in de grappige pakken maken genchips. De kleine naalden laten minuscule, bijna onzichtbare stukjes DNA op glasplaatjes vallen. En waar komt het DNA vandaan? Van baby's. Duizenden van hen.

Elke chip kan tachtigduizend verschillende DNA-testen ondersteunen.

MARK SCHENA (Stanford universiteit): Dus met een enkele chip kun je in principe bijvoorbeeld 1000 baby's testen op 80 verschillende menselijke ziekten. Dus binnen een paar minuten kun je duizenden of zelfs tienduizenden baby's in één experiment uitlezen.

ROBERT KRULWICH: Baby's worden al routinematig getest op een handvol ziekten. Maar met genchips kon iedereen worden getest op honderden aandoeningen.

MARK SCHENA: Weten is geweldig. Vroeg op de hoogte is nog beter. En dat is echt wat de technologie ons in staat stelt te doen.

ROBERT KRULWICH: Nou, een test doen en weten is geweldig voor de baby of voor wie dan ook, zolang je er maar iets aan kunt doen. Maar denk hier eens over na, want soms kan er een test zijn, maar het kan 20 jaar of 50 jaar duren. 50 jaar om een ​​geneesmiddel te vinden. Dus je zou de test kunnen doen en je zou kunnen leren dat er een ziekte op je pad komt, maar je kunt er niets aan doen. Wil je het nog weten?

Of je zou de test kunnen doen, maar de test zal niet zeggen dat je de ziekte gaat krijgen, het zal gewoon zeggen dat je een ziekte kunt krijgen. En zoals je weet is er een groot verschil tussen 'je wilt' en 'je mag'.

Lissa Kapust en Lori Seigel zijn zussen die de hartverscheurende ervaring van kanker in de familie deelden. Lang geleden waren er drie zussen. En toen werd in 1979 bij de jongste van de drie, Melanie, eierstokkanker vastgesteld.

LISSA KAPUST (zus van eierstokkankerpatiënt): Toen mijn zus de diagnose kreeg, was mijn reactie ongeloof. Ze was 30 jaar oud. En ik had nog nooit geweten dat iemand van die leeftijd eierstokkanker had.

ROBERT KRULWICH: Melanie vocht vier jaar tegen haar kanker, maar stierf in 1983. Het leek een op zichzelf staand ongeluk. Maar toen, ongeveer een jaar later, ontdekte Lissa dat ze borstkanker had. Ze was pas 34. Maar de kanker was niet uitgezaaid, dus de vooruitzichten op de lange termijn leken optimistisch.

LISSA KAPUST: Ik had eigenlijk een radiotherapeut die de beste was in het veld, veel boeken schreef over borstkanker en erg optimistisch was. En wat ik me herinner dat hij zei, is dat hij en ik samen oud zouden worden.

ROBERT KRULWICH: En met Lissa ging het 12 jaar goed. Toen vond ze nog een knobbel in dezelfde borst.

LISSA KAPUST: Het was de ergste angst die uitkwam. De eerste keer dat ik hoop kon houden. De tweede keer had niemand het met mij over oud worden.

ROBERT KRULWICH: Toen Lissa in 1996 haar tweede kanker ontdekte, begonnen wetenschappers net het verband uit te werken tussen borst- en eierstokkanker die in families voorkomen. Mary-Claire King was een van de wetenschappers die ontdekte dat veranderingen of mutaties in twee specifieke genen het risico van een vrouw op borst- en eierstokkanker veel groter maken.

De genen heten BRCA 1 en 2.

MARY-CLAIRE KING (Universiteit van Washington): BRCA 1 en BRCA 2 zijn perfect gezonde, normale genen die we allemaal hebben, maar in een paar families worden mutaties in deze genen geërfd.

ROBERT KRULWICH: Dus in een normaal gen&mdashsee gaan we het hier letter voor letter voor je spellen&mdashdit is de normale volgorde die eindigt op GTAGCAG T. Nu gaan we een kopie maken nu gaan we twee van de letters verliezen, slechts twee en dan. zien? Kijk hoe ze overschakelen. Zie je dat? Deze nieuwe configuratie is een mutatie die vaak borstkanker kan veroorzaken.

MARIA-CLAIRE KONING: In de Verenigde Staten en West-Europa en Canada is het risico op het ontwikkelen van borstkanker voor vrouwen in de gehele bevolking ongeveer 10 procent in de loop van haar leven, waarbij het grootste deel van dat risico zich natuurlijk later in haar leven voordoet. Voor een vrouw met een mutatie in BRCA 1 of BRCA 2 is het levenslange risico op borstkanker ongeveer 80 procent. Het is erg hoog.

ROBERT KRULWICH: Precies rond de tijd van Lissa's tweede aanval van borstkanker, kwam er een test voor BRCA-mutaties beschikbaar. Lissa en haar zus Lori besloten zich te laten testen.

LORI SIEGEL (zus van eierstokkankerpatiënt): Ik herinner me nog de dag dat ik de resultaten ging opzoeken. Paniek. Terreur. Ik bedoel, wat zou ik te weten komen? Over, je weet wel, het bloed dat door je slapen stroomt. Ik bedoel, ik herinner me alleen pure angst.

ROBERT KRULWICH: Blijkt dat Lori in orde was. Maar Lissa ontdekte dat ze wel degelijk een BRCA-mutatie heeft. Het is niet gemakkelijk om elke ochtend wakker te worden en je af te vragen of het vandaag de dag is dat je misschien ziek wordt.

DOKTER: Vragen over de uitslag van de biopsie van april?

LISSA KAPUST: Geen vragen over de resultaten. Opnieuw voelt het alsof mijn leven kogels ontwijkt.

ROBERT KRULWICH: Bij de tweede kanker liet Lissa haar rechterborst volledig verwijderen en daarna nog een operatie om haar eierstokken eruit te halen.

VERPLEEGSTER: Oké, hou je vuist tot ik binnen ben.

ROBERT KRULWICH: Ze heeft ook een hoog risico op kanker in haar linkerborst. BRCA-mutaties zijn relatief zeldzaam en veroorzaken slechts vijf of tien procent van alle borstkanker. Maar weten dat er een BRCA-mutatie in de familie is, raakt iedereen.

ERIC KAPUST: Het gen gaat niet weg. De tijd die is verstreken sinds de laatste kanker geeft je niet de veiligheid. En de gevolgen lopen door de familie. Ik veronderstel dat voor mijn dochter, die hier nog geen significante impact van heeft laten zien, de wetenschap dat er een genetische component is die ze niet kan ontkennen, haar leven op serieuze manieren zal kleuren.

ROBERT KRULWICH: Lissa's zoon, Justin, is 21. Haar dochter, Alanna, is 18. Er is een kans van fifty-fifty dat elk van hen de BRCA-mutatie van Lissa heeft geërfd. De enige manier om erachter te komen is door een test te doen. En wanneer moeten ze dat doen? Wanneer is het juiste moment?

ALANNA KAPUST (Dochter van borstkankerpatiënt): Ik heb er eigenlijk nooit echt over nagedacht tot biologie dit jaar, toen mijn leraar een hypothetische, zogenaamd, vraag aan mensen stelde en zei: "Wat zou je doen? Kun je je voorstellen wat je zou doen, als je geconfronteerd zou worden met de situatie waarin je wist dat je deze ziekte zou kunnen hebben die dodelijk zou zijn. Of je zou er ziek van worden en je zou een test kunnen doen om erachter te komen of je het had of niet?" En ik zat daar in de klas en zei: "Misschien is het niet zo hypothetisch."

ROBERT KRULWICH: En toen, in haar laatste jaar van de middelbare school, voelde Alanna een knobbel in haar eigen borst.

ALANNA KAPUST: Ik had het hele, "Oh, het kan mij niet gebeuren. Nog niet", zoiets. Ik bedoel, ik heb het voorbehoud in mijn achterhoofd dat het mij uiteindelijk heel goed kan overkomen en als dat zo is, dan zal ik er tegen vechten. Ik zal het dan afhandelen. Maar ik verwacht het niet. of ik had absoluut niet verwacht dat dit mij zou overkomen toen ik 17 jaar oud was.

ROBERT KRULWICH: Alanna's knobbel was geen kanker. En voorlopig wil ze de test niet. Want als ze wist dat ze het slechte gen had, had ze maar twee opties: de keuze om haar borsten en eierstokken te verwijderen om te proberen haar risico te verkleinen of gewoon nauwlettend in de gaten te worden gehouden en te wachten.

LISSA KAPUST: Ze wordt elk jaar gevolgd. Het lijkt een beetje jong om, weet je, haar te hebben. om dat onder ogen te moeten zien. Aan de andere kant voelt het ook als de riem en bretels techniek, we moeten er gewoon alles aan doen.

ROBERT KRULWICH: In de komende 20 jaar zal de hachelijke situatie van deze familie steeds vaker voorkomen naarmate meer en meer genen worden gekoppeld aan steeds meer ziekten en er meer tests beschikbaar komen. Maar we zullen allemaal moeten vragen: "Willen we het weten?" En als we het weten, kunnen we dan leven met een antwoord dat misschien zegt, maar misschien ook niet?

LISSA KAPUST: Toen ik vandaag van mijn werk naar huis reed, was ik afgestemd op de openbare radio en er was een professor in de astronomie die sprak over een gloednieuwe telescoop om in de sterrenstelsels te kijken. En ze noemen het het equivalent van het Human Genome Project. En ik dacht: "Hmm, niet helemaal het equivalent van het Human Genome Project." Omdat het zonder een aantal van de ethische, morele angst en echte mensenkwesties is waar het een beetje een achtbaanrit is tussen, weet je, "Dit gaat antwoorden bevatten, en hoop, en behandelingen, en interventies, en genezing." Tegenover: "Het is niet duidelijk wat dit allemaal betekent."

ROBERT KRULWICH: En als de zaken nu niet duidelijk zijn, hoe zit het dan met de toekomst, wanneer we niet alleen ziekten kunnen genezen, maar nog veel meer kunnen doen?

GATTACA GENETISCHE COUNSELOR: "Je geëxtraheerde eieren, Marie, zijn bevrucht met Antonio's sperma. Je hebt bruine ogen, donker haar en een lichte huid gespecificeerd. Het enige dat overblijft is om de meest geschikte kandidaat te selecteren. Ik ben zo vrij geweest om alle potentieel nadelige omstandigheden uit te roeien: vroegtijdige kaalheid, bijziendheid, alcoholisme, zwaarlijvigheid, et cetera."

GATTAC MA: "We wilden niet. Ik bedoel. ziektes. ja, maar."

GATTAC PAPA: 'Oké. En we vroegen ons af of het goed was om een ​​paar dingen aan het toeval over te laten.'

GATTACA GENETISCHE COUNSELOR: "U wilt uw kind de best mogelijke start geven. En onthoud dat u dit kind nog steeds bent, gewoon de beste van u. U kunt duizend keer op natuurlijke wijze zwanger worden en nooit zo'n resultaat krijgen."

FRANCIS COLLINS: Gattaca echt een aantal interessante punten naar voren gebracht. De technologie die daar wordt beschreven, bevindt zich in feite recht voor ons of bijna voor ons.

ROBERT KRULWICH: Dat lijkt me bijna zeer waarschijnlijk dat dit zal gebeuren, want welke ouder zou een kind niet willen introduceren dat dat niet zou hebben. tenminste zijn waar alle andere kinderen zouden kunnen zijn?

FRANCIS COLLINS: Daarom is het scenario huiveringwekkend. Het beeldde een samenleving uit waar genetisch determinisme in feite op hol was geslagen. Ik denk dat de samenleving in het algemeen heeft geglimlacht om het gebruik van genetica voor het voorkomen van vreselijke ziekten. Maar wanneer je die grens begint te vervagen om je kinderen genetisch anders te maken op een manier die hun prestaties op de een of andere manier verbetert, begint dat de meesten van ons ongemakkelijk te maken.

ROBERT KRULWICH: Wat als we in de wereld van Star Trek Voyager zouden leven? Over ongemakkelijk gesproken. Luitenant Torres is 50 procent mens en 50 procent Klingon. Ze is ook 100 procent zwanger. Zoals elke zorgzame ouder wil ze niet dat haar ongeboren kind wordt geplaagd omdat het een voorhoofd heeft dat eruitziet. nou ja, als een bandenprofiel. Maar hier is de wending. Ze kan er iets aan doen.

Mmm, ze deed er ook wat blond haar in.

En is dit de limiet? Of zouden we nog verder kunnen gaan? Als je al deze dingen uiteindelijk kunt isoleren, kun je dan een wezen bouwen dat nog nooit eerder heeft bestaan? Ik wil bijvoorbeeld het gezichtsvermogen van een havik en ik wil het gehoor van een hond. Anders ben ik best tevreden om precies te zijn zoals ik ben. Dus, zou ik het gezichtsvermogen en het gehoor kunnen plukken en erin plakken?

ERIK LANDER: Nou, dat weten we niet. We weten echt niet hoe die engineering plaatsvindt en hoe we het kunnen verbeteren. Het zou net zoiets zijn als een hele stapel onderdelen naar een Boeing 777 en een hele stapel onderdelen naar een Airbus, en zeggen: "Wel, ik ga er een paar mixen en matchen, zodat het een aantal van de eigenschappen. Ik maak het wat dikker, maar ik wil het ook wat korter maken." En tegen de tijd dat je klaar was, zou je denken dat je veel slimme verbeteringen had aangebracht, maar het ding zou niet van de grond komen.

Het is een zeer complexe machine, en met een steeksleutel naar binnen gaan om een ​​stuk te verwisselen. de kans is groot dat de meeste veranderingen die we vandaag zouden maken, bijna alle veranderingen die we vandaag zouden maken, de machine zouden breken.

ROBERT KRULWICH: We zijn misschien nog niet in staat om mensen of Klingons genetisch te modificeren, maar we doen het elke dag bij planten en dieren. Kijk naar dit spul: tabaksplanten met een gen van een vuurvliegje. En ze gebruikten datzelfde insectengen om gloeiende muizen te maken. Het is dus theoretisch mogelijk dat we mensen zouden kunnen creëren met andere voordelen die geleend zijn van andere wezens.

ERIK LANDER: Klopt. Maar de nederigheid van de wetenschap op dit moment is om te beseffen hoe weinig we weten over hoe je daaraan zou kunnen beginnen. Het verschil tussen de biologie van de twintigste eeuw en de eenentwintigste eeuw is dat het nu onze taak is, in deze eeuw, om uit te zoeken hoe de onderdelen in elkaar passen.

ROBERT KRULWICH: En net toen de twintigste eeuw ten einde liep, kwam de race om het genoom te voltooien op volle toeren. De competitieve sappen vloeiden.

J. CRAIG VENTER: Ik ben competitief, maar als de sociale orde je niet toestaat om vooruitgang te boeken, en dat geldt voor de meeste mensen niet, dan zeg ik: "Naar de hel met de sociale orde. Wel, ik zal een nieuwe manier vinden om het te doen. "

TONY WIT: Het veranderde het paradigma van mensen, en daar houden mensen niet van. Het was erg beledigend voor deze mensen: "Hoe durven ze," je weet wel, "regen op onze parade? Dit is ons terrein."

ERIK LANDER: Dit was een uitdaging voor het hele idee van het openbaar genereren van gegevens. Dat was wat mensen beledigde, was dat we echt diep voelden dat dit gegevens waren die voor iedereen beschikbaar moesten zijn. En er was een poging om de publieke verbeelding te claimen voor de stelling dat deze gegevens beter op een of andere privémanier konden worden gedaan en eigendom waren.

TONY WIT: Weet je, je wilt zeggen: "Nou, wacht eens even. Als je het in twee jaar zou kunnen doen, waarom deed je het dan niet in twee jaar? Waarom moesten we langskomen om een ​​15-jarig project om te zetten in een tweejarig project."

ERIK LANDER: Ik moet zeggen dat het menselijk genoomproject een enorme hoeveelheid interne concurrentie had, zelfs tussen de academische groepen. Er is zeker concurrentie tussen academische wetenschappers, en meer dan wat dan ook, er is concurrentie tegen ziekten. Er is een sterk gevoel dat wat we proberen uit te vinden de belangrijkste informatie is die je zou kunnen krijgen.

TONY WIT: Ik weet het niet. Ik bedoel, ik hoop dat dit allemaal zal verdwijnen.

ROBERT KRULWICH: In juni 2000 ging het min of meer weg. De controversiële race om het genoom af te maken kwam tot een einde. En de winnaar was.

Nou, je hebt het waarschijnlijk gehoord. Ze besloten het een gelijkspel te noemen.

FRANCIS COLLIINS: Ik denk dat zowel Craig als ik echt moe waren van de manier waarop de voorstellingen zich hadden afgespeeld en wilden dat soort dingen achter ons laten. Het was waarschijnlijk niet goed voor Celera als bedrijf om dit beeld te hebben van altijd in strijd te zijn met het openbare project. Het was zeker niet goed dat het openbare project werd gezien als een gevecht met een onderneming uit de particuliere sector.

ROBERT KRULWICH: President Clinton zelf zorgde ervoor dat het publiek en de jongens van Celera aardig speelden, elkaar de hand schudden en de eer delen voor het sequencen van het genoom.

BANDEN VAN PRESIDENT WILLIAM JEFFERSON CLINTON: "Bijna twee eeuwen geleden, in deze kamer, op deze verdieping, spreidden Thomas Jefferson en een vertrouwde assistent een prachtige kaart uit. De assistent was Meriwether Lewis, en de kaart was het product van zijn moedige expeditie over de Amerikaanse grens helemaal naar de Stille Oceaan. Vandaag voegt de wereld ons hier in de East Room om een ​​kaart van nog grotere betekenis te aanschouwen. We zijn hier om de voltooiing van het eerste onderzoek van het gehele menselijke genoom te vieren. Dit is zonder twijfel de belangrijkste, meest wonderbaarlijke kaart ooit gemaakt door de mensheid."

ROBERT KRULWICH: En waar heeft deze kaart het over? Hoe ziet het eruit? Als we door het landschap van ons DNA kijken naar de 30.000 genen waaruit een mens bestaat, wat zien we dan?

ERIK LANDER: Het genoom is erg klonterig.

ROBERT KRULWICH: Heel klonterig?

ERIK LANDER: Zeer klonterig, zeer ongelijk. Je zou kunnen denken dat als we 30.000 genen hebben, ze een beetje uniform over de chromosomen zijn verdeeld. Niet zo. Ze worden verspreid zoals mensen in Amerika worden verspreid: ze zijn allemaal op sommige plaatsen opeengepakt, en dan heb je uitgestrekte vlaktes waar niet veel mensen zijn. Zo is het ook met de genen. Er zijn echt gen-dichte regio's die 15 keer de dichtheid van genen kunnen hebben, een soort van New York City hier. En er zijn andere regio's die twee miljoen letters kunnen bevatten en daar is geen gen te vinden. Het opmerkelijke aan ons genoom is hoe weinig gen er in zit. We hebben drie miljard letters DNA, maar slechts één, één komma vijf procent ervan is gen.

ROBERT KRULWICH: Anderhalf procent?

ERIK LANDER: De rest, 99 procent, is spul.

ROBERT KRULWICH: Spullen. Dit is een technische term?

ERIK LANDER: Een technische term. Meer dan de helft van je totale DNA is niet echt van jou. Het bestaat uit egoïstische DNA-elementen die op de een of andere manier ongeveer anderhalf miljard jaar geleden in ons genoom zijn terechtgekomen en rondhuppelen en kopieën van zichzelf maken. Aan die egoïstische DNA-elementen. we zijn slechts een gastheer voor hen. Ze zien de mens net als een voertuig om zichzelf over te dragen.

ROBERT KRULWICH: Wacht even, wacht even, wacht even. We hebben in elk van onze cellen die DNA dragen, we hebben deze kleine, het zijn geen wezens, ze liften gewoon? Lifters?

ERIK LANDER: Liftende stukjes DNA.

ROBERT KRULWICH: En hoe lang zitten ze al in ons?

ERIK LANDER: Ongeveer anderhalf miljard jaar of zo.

ROBERT KRULWICH: En alles wat ze hebben gedaan is voor zover je kunt zeggen, daar blijven en zich vermenigvuldigen?

ERIK LANDER: Nou, ze bewegen rond.

ROBERT KRULWICH: En wat is dat? Hoe heet dat? Ik bedoel, het is geen dier, het is geen groente, het is gewoon.

ERIK LANDER: Het is gewoon een gen dat voor zichzelf weet te zorgen en voor niets anders.

ROBERT KRULWICH: En het rijdt gewoon in ons rond, door de tijd?

ERIK LANDER: Het rijdt in ons rond. Het grootste deel van ons genoom is dit spul, niet wij.

ROBERT KRULWICH: Wauw. Het is een beetje nederig om te bedenken dat wij, het toonbeeld van dieren, de architecten van grote beschavingen, als taxi's worden gebruikt door een stel loslopende parasieten die niets om ons kunnen geven. Maar dat is het mysterie van alles.

ERIK LANDER: Als je het genoom leest, besef je dat we zo veel op elk ander levend wezen op deze planeet lijken. En elke innovatie in ons & mdashwe hebben het niet echt uitgevonden. Dit waren allemaal dingen die we van onze voorouders hadden geërfd.

Dit geeft je een enorm respect voor het leven. Het geeft je respect voor de complexiteit van het leven, de innovatie van het leven en de enorme verbondenheid tussen al het leven op de planeet.

ROBERT KRULWICH: We zijn, in een zeer reële zin, gewone wezens. Onze onderdelen zijn uitwisselbaar met alle andere dieren en zelfs de planten om ons heen! En toch weten we dat er iets aan ons is dat echt buitengewoon is.

Wat het is, weten we niet. Maar wat het doet, is dat het ons vragen laat stellen en de berichten onderzoekt en overdenkt die begraven liggen in een molecuul in de vorm van een gedraaide trap. Dat is wat wij, en misschien alleen wij, kunnen doen.

Nerf® is een geregistreerd handelsmerk van Hasbro, Inc.


HISAT2 en HISAT-genotype zijn open-sourcesoftware die vrij beschikbaar is op https://github.com/DaehwanKimLab/hisat2. Het HISAT2-pakket bevat programma's en applicatie-programmeerinterfaces voor C++, Python en JAVA die snel genomische locaties ophalen uit herhaalde uitlijningen voor gebruik in stroomafwaartse analyses zoals variantoproep, piekoproep en differentiële genexpressie-analyse.

1000 Genomes Project Consortium Een kaart van menselijke genoomvariatie door sequencing op populatieschaal. Natuur 467, 1061–1073 (2010).

1000 Genomes Project Consortium Een geïntegreerde kaart van genetische variatie van 1092 menselijke genomen. Natuur 491, 56–65 (2012).

GTEx Consortium Het project Genotype-Tissue Expression (GTEx). nat. Genet. 45, 580–585 (2013).

Lappalainen, T. et al. Transcriptoom- en genoomsequencing onthult functionele variatie bij mensen. Natuur 501, 506–511 (2013).

t Hoen, P.A. et al. Reproduceerbaarheid van mRNA met hoge doorvoer en kleine RNA-sequencing in laboratoria. nat. Biotechnologie. 31, 1015–1022 (2013).

Sanders, S.J. et al. De novo mutaties onthuld door whole-exome sequencing zijn sterk geassocieerd met autisme. Natuur 485, 237–241 (2012).

Krumm, N. et al. Overtollig zeldzame, erfelijke afknottingsmutaties bij autisme. nat. Genet. 47, 582–588 (2015).

Leinonen, R., Sugawara, H., Shumway, M. & International Nucleotide Sequence Database Consortium. De volgorde lees archief. Nucleïnezuren Res. 39, D19-D21 (2011).

Lander, E.S. et al. Initiële sequencing en analyse van het menselijk genoom. Natuur 409, 860–921 (2001).

Sherry, S.T. et al. dbSNP: de NCBI-database van genetische variatie. Nucleïnezuren Res. 29, 308–311 (2001).

Lappalainen, I. et al. DbVar en DGVa: openbare archieven voor genomische structurele variatie. Nucleïnezuren Res. 41, D936-D941 (2013).

Burrows, M. & Wheeler, D. J. Een algoritme voor gegevenscompressie zonder verlies van bloksortering. SRC-onderzoeksrapport 124 (Digital Equipment Corporation, 1994).

Ferragina, P. & Manzini, G. in Proceedings 41e jaarlijkse symposium over fundamenten van computerwetenschappen, IEEE Computer Society 390–398 (2000).

Langmead, B., Trapnell, C., Pop, M. & Salzberg, S.L. Ultrasnelle en geheugenefficiënte uitlijning van korte DNA-sequenties op het menselijk genoom. Genoom Biol. 10, R25 (2009).

Li, H. & Durbin, R. Snelle en nauwkeurige korte uitlijning met Burrows-Wheeler-transformatie. Bio-informatica 25, 1754–1760 (2009).

Li, R. et al.SOAP2: een verbeterde ultrasnelle tool voor uitlijning van korte uitlezingen. Bio-informatica 25, 1966–1967 (2009).

Kent, W.J. BLAT - het BLAST-achtige uitlijningshulpmiddel. Genoom onderzoek. 12, 656–664 (2002).

Li, H., Ruan, J. & Durbin, R. Het in kaart brengen van korte DNA-sequencing-lezingen en oproepen van varianten met behulp van mapping-kwaliteitsscores. Genoom onderzoek. 18, 1851–1858 (2008).

Garrison, E. et al. De toolkit voor variatiegrafieken verbetert de leesmapping door genetische variatie in de referentie weer te geven. nat. Biotechnologie. 36, 875–879 (2018).

Rakocevic, G. et al. Snelle en nauwkeurige genomische analyses met behulp van genoomgrafieken. nat. Genet. 51, 354–362 (2019).

Siren, J., Valimaki, N. & Makinen, V. Indexeringsgrafieken voor padquery's met toepassingen in genoomonderzoek. IEEE-ACM Trans. Berekenen. Biol. Bio-informeren. 11, 375–388 (2014).

Kim, D., Langmead, B. & Salzberg, S. L. HISAT: een snel gesplitste aligner met weinig geheugen. nat. Methoden: 12, 357–360 (2015).

Robinson, J. et al. De IPD- en IMGT/HLA-database: databases met allelvarianten. Nucleïnezuren Res. 43, D423-D431 (2015).

Hares, D.R. Uitbreiding van de CODIS-kernloci in de Verenigde Staten. Forensische wetenschap. Int. Genet. 6, e52-e54 (2012).

Luo, R. et al. SOAPdenovo2: een empirisch verbeterde geheugen-efficiënte short-read de novo assembler. Gigascience 1, 18 (2012).

Compeau, P.E., Pevzner, P.A. & Tesler, G. Hoe de Bruijn-grafieken toe te passen op genoomassemblage. nat. Biotechnologie. 29, 987–991 (2011).

Li, H. Uitlijnen van sequentielezingen, kloonsequenties en assemblagecontigs met BWA-MEM. Voordruk op https://arxiv.org/abs/1303.3997 (2013).

Langmead, B. & Salzberg, S. L. Snelle uitlijning met gapped-read met Bowtie2. nat. Methoden: 9, 357–359 (2012).

Eberle, M.A. et al. Een referentiegegevensset van 5,4 miljoen gefaseerde menselijke varianten, gevalideerd door genetische overerving van het sequencen van een stamboom van drie generaties van 17 leden. Genoom onderzoek. 27, 157–164 (2017).

Erlich, R.L. et al. Sequencing van de volgende generatie voor HLA-typering van klasse I loci. BMC Genomics 12, 42 (2011).

Lee, H. & Kingsford, C. Kourami: grafiekgestuurde assemblage voor nieuwe ontdekking van het allel van menselijke leukocytenantigenen. Genoom Biol. 19, 16 (2018).

Li, H. Minimap en miniasm: snelle mapping en de novo-assemblage voor luidruchtige lange reeksen. Bio-informatica 32, 2103–2110 (2016).

Pachter, L. Modellen voor transcript kwantificering van RNA-Seq. Voordruk op https://arxiv.org/abs/1104.3889 (2011).

Kim, D., Song, L., Breitwieser, F. P. & Salzberg, S. L. Centrifuge: snelle en gevoelige classificatie van metagenomische sequenties. Genoom onderzoek. 26, 1721–1729 (2016).


Genoomvergelijking Filosofie en benadering

Om een ​​frisse en minder bevooroordeelde vergelijking van het chimpansee en het menselijke genoom uit te voeren, werd een studie uitgevoerd om de jachtgeweersequentie van het hele genoom van de chimpansee (WGSS - dezelfde als die gebruikt door Wood 2011) te ondervragen tegen vier beschikbare versies van het menselijk genoom. In theorie wordt verondersteld dat de chimpansee WGSS willekeurig is, omdat deze is afgeleid van fysiek geschoren (gefragmenteerd) genomisch DNA dat is gekloneerd in plasmide-sequencing-vectoren. Een gecomprimeerd archief van precies 40.000 geselecteerde WGSS-lezingen kan worden gedownload van het National Center for Biotechnology (NCBI www.ncbi.nlm.nih.gov). Er werd een 'TRACEINFO' xml-bestand bijgevoegd waarin de chimpanseesequenties werden beschreven als volledig verwerkt - bijgesneden voor basen van lage kwaliteit en verontreinigende vectorsequenties. Ondanks dat de bestanden worden vermeld als trace reads, waren het geen onbewerkte, onverwerkte reads, zoals Wood beweerde in zijn samenvatting van 2011. Daarom waren de sequenties direct bruikbaar voor zoekopdrachten met het Basic Local Alignment Search Tool (BLAST)-algoritme (Altschul et al. 1990) zonder enige aanvullende verwerking om de kwaliteit te verbeteren.

Voor de doeldatabase werden de meest recente BLAST-voorgeformatteerde archiefbestanden voor het samenstellen van het menselijk genoom gedownload van een FTP-archief bij NCBI. Volgens meer gedetailleerde informatie die is ontvangen via persoonlijke communicatie met NCBI-personeel, bevat het archief vier verschillende assemblages van het menselijk genoom (GRCH37, GRCH36, de Alternate Assembly en de Celera Assembly). Deze assemblages ondergingen geen pre-maskering van een sequentie met een lage complexiteit, waardoor het mogelijk werd om vier verschillende complete assemblages van het gehele menselijke genoom in de doeldatabase op te nemen en de effecten van sequentiemaskering te testen.

Hoewel nu bekend is dat het grootste deel van het genoom algemeen functioneel is (Wells 2011), sluit het gebruik van sequentiemaskering met een lage complexiteit in BLASTN-zoekopdrachten veel van deze belangrijke genetische kenmerken uit. Argumenten om DNA-sequentiemaskering met een lage complexiteit toe te passen, werden gemaakt door de oorspronkelijke BLAST-ontwikkelaars (Altschul et al. 1994) op basis van het feit dat dergelijke sequenties vaak evolutionaire analyses verwarren en ze maken de volgende verklaring met betrekking tot deze DNA-kenmerken:

de meeste van deze segmenten geven over het algemeen geen betekenisvolle uitlijningen per positie op een manier die de feitelijke structurele en mutatiegeschiedenis weerspiegelt: ze evolueren blijkbaar relatief snel.

Een gebrek aan maskering van sequenties met een lage complexiteit veroorzaakt ook de opname van aanzienlijke hoeveelheden extra DNA-sequentie, wat resulteert in een duidelijke toename van computationele verwerkingsbronnen. Verbeteringen in de prestaties van computerhardware sinds 1994 maken grootschalige DNA-analyses echter meer haalbaar en het opnemen van sequenties met een lage complexiteit is nu gemakkelijk te testen. Daarom werden twee afzonderlijke reeksen experimenten gebruikt. Eén reeks experimenten maakte gebruik van maskering voor zowel de vraag als het onderwerp, terwijl de andere de maskering volledig uitschakelde.

Het heuristische BLASTN-algoritme is zeer geschikt voor rekenkundig veeleisende zoekopdrachten van zeer grote DNA-databases - het doel is de lokale identificatie van regio's van overeenkomst voor korte segmenten van de DNA-sequentie zoals de individuele chimpansee WGSS die elk gemiddeld 740 basen heeft. Het BLASTN-algoritme werkt door korte overeenkomsten te initiëren op basis van de gedefinieerde woordgrootte (aantal identieke DNA-basen). Deze initiële seed-matches worden vervolgens achtereenvolgens uitgebreid in beide richtingen totdat de uitlijning niet langer op een significant niveau bestaat (gebaseerd op de vooraf ingestelde e-waarde) of een van de twee uitgelijnde sequenties eindigt. Hoewel er overvloedige gepubliceerde literatuur is over het gebruik en de mechanica van het BLAST-algoritme voor het zoeken naar eiwitgerelateerde overeenkomsten, bestaat er minimaal onderzoek naar de exploitatie van parameters in de vorm van de nucleotide-versie voor grootschalige genoombrede studies. Het originele artikel dat is gepubliceerd om het BLAST-algoritme te beschrijven, is nog steeds een van de meest informatieve (Altschul et al. 1990). Voor een meer actueel en uitgebreid overzicht van het BLAST-algoritme, zie Mitrophanov en Borodovsky (2006).

Om een ​​uitgebreide reeks resultaten te produceren, werd besloten dat een verscheidenheid aan BLASTN-algoritme-parametercombinaties in afzonderlijke computationele experimenten de meest effectieve benadering zou zijn - ongeveer vergelijkbaar met die eerder door Altschul et al. (1990). In het bijzonder werden combinaties van drie parameters voor woordgrootte (7, 11 en 15) en vijf parameters voor e-waarde (1000, 10, 0,1, 0,001 en 0,0001) getest. Hoe lager de e-waarde die is ingesteld, hoe strenger en nauwkeuriger de sequentie-overeenkomst zal worden uitgevoerd door het algoritme. Altschul et al. (1990) laten in de originele BLAST-paper zien dat woordgrootte en e-waarde de belangrijkste algoritmeparameters zijn om te testen in elke fundamentele BLAST-analyse.

Samenvattend werden twee sets van combinaties van 15 woordgrootte en e-waarde uitgevoerd: een set experimenten maakte gebruik van maskering voor zowel de zoekopdracht als het onderwerp, terwijl de andere dit uitschakelde. Voor alle 30 afzonderlijke BLASTN-experimenten werden in totaal 1,2 miljoen (40.000 zoekopdrachten per experiment) uitgevoerd tegen vier afzonderlijke versies van het verzamelde menselijke genoom (

Aangezien de genoombrede analyses een grote hoeveelheid cumulatieve en vergelijkende gegevens vereisten, werd alleen de topuitlijning voor elke databasetreffer (als deze bestond) geretourneerd. Gapping werd om verschillende redenen niet toegestaan. Ten eerste, Altschul et al. (1990) stelden vast dat de toevoeging van gap-strategieën voor uitlijningen die waren ontworpen om regio's met lokale overeenkomst te lokaliseren met behulp van BLAST verwaarloosbaar was. Ten tweede maakt een objectieve vergelijking tussen alle zoekopdrachten het gebruik van gaping met het algoritme teniet. Ten slotte omvatten de beste lokale paarsgewijze uitlijningen die werden verkregen een verscheidenheid aan zeer liberale tot zeer strikte aanpassingsparameters voor woordgrootte en e-waarde.

Voor de berekening van de teststatistiek die bepaalt of de querysequentie een significante matchscore registreert op basis van de vooraf toegewezen e-waarde, wordt de ingebouwde standaard nucleotidesubstitutiematrix gebruikt. In de NCBI-versie van BLASTN kan deze functie niet worden aangepast. De BLASTN-substitutiematrix in oudere niet-commerciële WUBLAST-pakketten is eerder aangepast voor optimalisatie van microarray-probes (Ekland et al. 2010).


De genen- en eiwitcatalogus van chromosoom 19

Een geautomatiseerde pijplijn van evidence-based en ab initio methoden werden gebruikt om genmodeltranscripten op de onderliggende genoomsequentie te plaatsen. Hierna werd elk transcript handmatig beoordeeld met behulp van een combinatie van door mensen tot expressie gebracht sequentiebewijs (messenger-RNA en tot expressie gebrachte sequentietags (EST's)) en homologie met bekende genen bij mensen, muizen en andere organismen. Aanvullende genen werden handmatig geïdentificeerd uit onderliggende experimentele gegevens. Uiteindelijk werden in totaal 1.461 eiwitcoderende regio's geverifieerd als geldige genloci (zie aanvullende S2). Deze loci bevatten 2.341 transcripten van volledige lengte (of bijna volledige lengte), evenals gedeeltelijk bewijs voor aanvullende splitsingsvarianten zoals hieronder besproken. We plaatsten loci in de volgende drie categorieën: (1) 'bekende' genen die overeenkomen met RefSeq-genen 23 , menselijke complementaire DNA- of eiwitsequenties (2) 'nieuwe' of niet-geïdentificeerde loci met een open leesraam (ORF) groter dan 100 aminozuren, en/of identiek zijn aan een gesplitst menselijk EST, en/of homologie hebben met bekende genen of eiwitten (alle soorten) en (3) 'pseudogenen', waarvan de sequentie vergelijkbaar is met genen of eiwitten die elders in het genoom worden gevonden maar missen de introns die aanwezig zijn in de originele versie (verwerkt) en/of hebben een verstoorde of gedeeltelijke ORF. Transcripten waarvoor geen uniek ORF kon worden bepaald en vermoedelijke genen (ab initio modellen) zonder ondersteunend experimenteel bewijs werden niet als geldig beschouwd.

We identificeerden 1.320 bekende loci op basis van 1.551 RefSeq-genen en andere cDNA-sequenties van bijna volledige lengte in GenBank die zijn toegewezen aan chromosoom 19. Op basis van EST-bewijs waren we in staat om 60% van deze RefSeq-transcripten met meer dan 50 nucleotiden op de 5′ en/of 3′ uiteinden met behoud van de originele ORF. Een totaal van 41% van de RefSeq-loci was verlengd aan het 5'-uiteinde, waardoor de transcriptionele startplaats voor deze transcripten nauwkeuriger werd gelokaliseerd. In totaal eindigt 88% van de transcripten met een stop in het laatste exon/niet-vertaalde gebied.

We hebben bewijs gevonden voor 141 nieuwe loci waarvoor geen RefSeq-genen beschikbaar waren. Deze loci worden ondersteund door andere cDNA-sequenties van bijna volledige lengte, een of meer gesplitste EST's en/of gelijkenis met bekende sequenties van mensen of muizen. Binnen deze groep zijn 58 menselijke loci gemodelleerd met behulp van orthologe muis-cDNA-sequenties. Transfer-RNA-genen zijn een van de best begrepen niet-eiwit-coderende RNA-genen met betrekking tot functie. We voorspelden vol vertrouwen 11 tRNA-genen en drie tRNA-pseudogenen, in schril contrast met de 157 tRNA's gevonden op de p-arm van chromosoom 6 (ref. 17).

Het grootste gen op chromosoom 19 is de alfa 1A-subeenheid van het P/Q-type spanningsafhankelijke calciumkanaal (CACNA1A), die zich uitstrekt over meer dan 300 kilobasen (kb) en 47 exons bevat. Het transcript met de meeste exons is de skeletspier-ryanodinereceptor (RYR1), die 105 exons heeft verspreid over bijna 154 kb. Het grootste exon op het chromosoom is 21.693 bp en wordt gevonden in de MUC16 gen, een gen dat codeert voor een ongewoon groot transmembraan glycoproteïne dat een rol speelt bij embryonale ontwikkeling en neoplastische transformatie 24 .

Alternatieve splicing

We hebben de mate van alternatieve splicing gekarakteriseerd op basis van de bestaande cDNA/EST-gegevens. Alleen rekening houdend met mRNA-sequenties in GenBank, identificeerden we 2.341 verschillende chromosoom 19-transcripten die een gemiddelde dekking van 1,6 geannoteerde transcripten per locus opleverden (zie aanvullende S2). Deze mRNA's leveren sterk bewijs voor alternatieve splicing van 568 (39%) van de 1.461 geannoteerde genloci, waarbij elk twee of meer geassocieerde transcripten heeft. Verder hebben nog eens 452 genen ten minste één EST-sequentie die overlapt met niet-geannoteerde exons en bevatten ook flankerende canonieke splitsingsplaatsen op de genomische locus. Bestaande experimentele gegevens ondersteunen dus alternatieve splicing voor minimaal 1.020 van de genen (70%) op chromosoom 19.

Het is waarschijnlijk dat een nog grotere fractie van chromosoom 19-genen onderhevig is aan een of andere vorm van alternatieve splicing. Aangezien de meeste van onze conclusies gebaseerd zijn op bestaande getranscribeerde sequentiegegevens, lijkt de diepte van de EST-database een beperkende factor te zijn. In feite vertoonden van de 184 genen met in totaal 500 of meer overlappende EST's, 181 (98%) laagfrequente alternatieve transcripten. Een diepere EST-kloondekking zou dus waarschijnlijk aantonen dat een zeer grote fractie van loci alternatieve splicing kan vertonen. Recente studies ondersteunen deze conclusie 25 .

Pseudogenen

We identificeerden 321 pseudogenen op chromosoom 19 (zie aanvullende S3). Hiervan werden 177 (55%) geclassificeerd als 'verwerkte' pseudogenen, dat wil zeggen producten van virale retrotranspositiegebeurtenissen waarbij gesplitste boodschapper-RNA's betrokken zijn die vaak kunnen worden geïdentificeerd door de afwezigheid van introns die aanwezig zijn in de ouderlocus en door de aanwezigheid van poly(A) rekken ingebed in de aangrenzende genoomsequentie. Zesenveertig (14%) pseudogenen kwamen waarschijnlijk voort uit genomische duplicatiegebeurtenissen, waarbij overblijfselen van introns van de ouderlocus werden weergegeven. Nog eens 98 (31%) pseudogenen werden geclassificeerd als potentiële pseudogene fragmenten vanwege hun gedeeltelijke aard.

In totaal 70 (22%) van de 321 pseudogenen op chromosoom 19 bevatten ononderbroken, maar gedeeltelijke, ORF's en vertegenwoordigen waarschijnlijk jonge verwerkte pseudogenen die niet voldoende tijd hebben gehad om mutaties te accumuleren om hun ORF te verstoren, maar die mogelijk ook enige functie hebben behouden. Van de 22 olfactorische receptor loci die zijn geannoteerd als pseudogenen, bevatten er vier een compleet ORF. Recente onderzoeken hebben aangetoond dat een significant deel van de vermeende olfactorische receptor-pseudogenen in het genoom segregeert als allelen met intacte, vermoedelijk functionele kopieën in de menselijke populatie 26 . Of een olfactorische receptor of andere pseudogenen op chromosoom 19 ook bij mensen variëren tussen dergelijke potentiële functionele en niet-functionele toestanden, moet nog experimenteel worden onderzocht.

Genfamilies en duplicatieanalyse

Chromosoom 19 is opmerkelijk vanwege de prevalentie van duplicatiestructuren van twee typen: tandemgeclusterde genfamilies en grote segmentale duplicaties. Wat dit laatste betreft, vertoont chromosoom 19 bewijs van uitgebreide genomische duplicatie met 7,35% van de homologie van de sequentie die de sequentie deelt met meer dan één locatie in het genoom (Fig. 3 zie ook Aanvullende S4). Daarentegen voorspellen schattingen van het hele genoom van segmentale duplicatie 5-6% gedupliceerde sequentie met dezelfde uitlijningsparameters (≥ 1 kb lengte ≥ 90% sequentie-identiteit) 1 . Deze verrijking op chromosoom 19 is voornamelijk te wijten aan een toename van intrachromosomale duplicaties (6,20% van de sequentie) in plaats van interchromosomale duplicaties (1,69% van de sequentie). Met behulp van sequentiedivergentie als een surrogaat van evolutionaire leeftijd, geven deze gegevens aan dat de meeste tandem-uitbreidingen van duplicaties op chromosoom 19 veel eerder plaatsvonden (30-40 miljoen jaar geleden) in vergelijking met de meer recente interchromosomale duplicatiegebeurtenissen. Het meest opvallende kenmerk van het segmentale duplicatiepatroon op chromosoom 19 is het patroon van grote intrachromosomale duplicaties (> 90% sequentie-identiteit) geclusterd in tandemrangschikking (Fig. 3 zie ook Aanvullende S5).

een, Grote (> 20 kb), zeer vergelijkbare (> 95%) intrachromosomale (blauwe) en interchromosomale (rode) segmentale duplicaties worden getoond voor chromosoom 19. Chromosoom 19 is op grotere schaal getekend ten opzichte van de andere chromosomen. Genclusters gedetecteerd in gedupliceerde sequenties (> 1 kb met identiteit >90%) worden weergegeven als lichtblauwe balken onder de chromosoom 19-sequentie. A, B, ZNF-genen C, cytochroom P450 D, zwangerschapsspecifieke α-1-glycoproteïne (PSG) E, choriongonadotrofine -peptide (CGB) F, leukocyt-immunoglobuline-achtige receptor G, killer-cel-immunoglobuline-achtige receptor. B, Sequentieovereenkomst van segmentale duplicaties. Voor alle paarsgewijze uitlijningen werd het totale aantal uitgelijnde basen berekend en weggegooid op basis van het percentage sequentie-identiteit. Sequentie-identiteitsverdelingen voor interchromosomaal (rood) en intrachromosomaal (blauw) gedupliceerde basen worden getoond.

Meer dan 25% van de genen op chromosoom 19 zijn leden van grote, goed gedefinieerde, tandem geclusterde genfamilies (Fig. 4 en Tabel 2). Aanzienlijk bewijs heeft het bestaan ​​van afstammingsspecifieke veranderingen binnen deze en andere tandem geclusterde families gedocumenteerd als gevolg van aanhoudende genduplicatie, deletie en mutatiegebeurtenissen 27,28,29,30,31,32,33,34 . Deze geclusterde sets van paralogen vertegenwoordigen daarom een ​​potentieel rijke bron van genetische diversiteit, en vanwege hun prevalentie heeft chromosoom 19 een bijzonder dynamische evolutionaire geschiedenis. De grootste groep van dergelijke genen op chromosoom 19 codeert voor Krüppel-type (of C2H2) zinkvingertranscriptiefactor (ZNF)-eiwitten, waarbij 266 van de ongeveer 800 totale menselijke genen van dit type zich voornamelijk in 11 grote familiale clusters bevinden 27,29. Chromosoom 19 bevat leden van verschillende ZNF-gensubfamilies, maar de meeste geclusterde genen behoren tot het KRAB-ZNF-subtype (Tabel 2). Eén groot cluster van ZNF-genen, gelokaliseerd in het pericentromere gebied van de korte arm, is exclusief voor en ontstond vroeg in de afstamming van primaten30. Een uniek aspect van deze regio is de vermenging van klassieke centromere β-satellietsequenties met de ZNF-genen. Een totaal van 27 blokken van β-satellietherhaling (elk variërend van 10 tot 50 kb gemiddeld = 22 ± 8 kb) worden onmiddellijk distaal van de centromere α-satellietsequentie toegewezen. Deze blokken bevinden zich in de eerste 4 Mb van het pericentromere gebied van 19p12 met een gemiddelde van 114 kb die elk β-satellietblok scheidt. Tussen de meeste van deze β-satellietblokken zijn 1 tot 2 KRAB-ZNF-genen ingebed, wat aangeeft dat deze structuren gecoördineerd werden gedupliceerd30.

Bekende genen (november 2003) werden gedownload van de UCSC-browser (//genome.ucsc.edu) en uitgezet ten opzichte van de relatieve chromosoomgrootte (minus de centromeer). Gele driehoeken (geclusterde loci) geven genen in tandemduplicaties aan, terwijl blauwe ruiten (unieke loci) loci aangeven die niet op een tandemmanier worden gedupliceerd. Groene cirkels (alle loci) vertegenwoordigen de som van geclusterde en unieke loci. Een subset van de geclusterde loci waarbij de KRAB-Kruppel ZNF-genen niet zijn betrokken, wordt weergegeven als rode vierkanten (niet-ZNF geclusterde loci).Naast het grootste aantal genen heeft chromosoom 19 ook het grootste aantal genen in tandemgenfamilies.

Menselijk chromosoom 19 draagt ​​ook een grote verzameling genen die coderen voor receptoreiwitten met immunoglobuline-achtige domeinen. Genen van de nauw verwante leukocyt-immunoglobuline-achtige receptoren (LILRA en LILRB), de leukocyt-geassocieerde immunoglobuline-achtige receptoren (LAIR) en de killer-cel-immunoglobuline-receptoren (KIR) worden samen aangetroffen in het leukocytenclustergebied (LCR) van 19q13. 4. De eiwitten die door deze loci worden gecodeerd, functioneren als receptoren voor specifieke klassen van antigenen op het oppervlak van verschillende typen immuuncellen. Net als bij de ZNF- en olfactorische receptor (OR)-genen, verschillen de LAIR-, LILR- en KIR-genfamilies sterk in hun relatieve aantallen en typen tussen verschillende gewervelde geslachten. De verscheidenheid aan verschillende immunoglobuline-achtige receptoreiwitten kan enkele van de belangrijkste verschillen definiëren in strategieën die door bepaalde geslachten worden aangenomen om infectieuze agentia en antigenen die in verschillende omgevingen worden aangetroffen te bestrijden 31 . De KIR-genfamilie is recentelijk ontstaan ​​in de afstamming van primaten, en in overeenstemming hiermee varieert het repertoire van deze genfamilie zowel in genaantal als in type, zelfs tussen individuele mensen. Van specifieke KIR-haplotypes is aangetoond dat ze differentiële gevoeligheid voor immuungerelateerde ziekten bepalen, en zijn geassocieerd met differentiële snelheden van progressie tot aids bij met hiv geïnfecteerde personen 32 . Het KIR-haplotype dat wordt weergegeven in de openbare menselijke genoomsequentie komt overeen met het meest voorkomende haplotype in de Kaukasische populatie, A-1D genaamd (ref. 32). Dit draagt ​​negen van de zeventien eerder beschreven KIR-familieleden, waaronder een bekende deletievariant van de KIRDS4 plaats, KIR2DS4.

Er bestaan ​​verschillende andere grote en evolutionair diverse genclusters op het chromosoom, allemaal met verschillende evolutionaire geschiedenissen en betrokkenheid bij verschillende medische aandoeningen. Naast de genen van de LRC-familie zijn de snel evoluerende cytochroom P450-subfamilie II-genen (CYP2) 33 die betrokken zijn bij het metabolisme van steroïde hormonen, carcinogenen en andere stoffen, van bijzonder medisch belang, en de serineproteasefamilie kallikreïne (KLK) 34, geassocieerd met met tumorprogressie. De posities, grootte en functies van deze genfamilies zijn samengevat in Tabel 2.


RESULTATEN

De trefferkans van een seed hangt af van de lengte en gelijkenis van de gewenste uitlijningen. Verschillende aspecten van de relatie tussen deze vier entiteiten worden getoond in Figuren 2 en 3. Figuur 2 laat zien dat de kans op treffers sterk toeneemt met gelijkaardige uitlijning. Aan de andere kant laat figuur 3 zien dat de uitlijningslengte alleen een grote invloed heeft als deze klein is (een paar honderd basenparen).

We vergeleken ook de resultaten van de MegaBLAST-zoekopdrachten die werden uitgevoerd met verschillende aaneengesloten zaden. We hebben geverifieerd dat uitlijningen die worden gevonden door een bepaald zaadje te gebruiken, ook worden gedetecteerd met een kleiner zaadje. Voor elke uitlijning die werd verkregen door woordgrootte 16 te gebruiken, gebruikten we de lengte en gelijkenis van de uitlijning om de waarschijnlijkheid te berekenen dat de uitlijning zou worden gedetecteerd door een groter zaadje. Op basis van deze berekeningen hebben we het verwachte aantal treffers berekend dat zou worden geproduceerd door grotere woordgroottes te gebruiken. Het werkelijke en verwachte aantal treffers wordt weergegeven in figuur 4.

De trefferkans van uit elkaar geplaatste zaden varieert met de lengte van de uitlijning en gelijkenis op een manier die vergelijkbaar is met die van aangrenzende zaden. Over het algemeen heeft een zaadje op afstand altijd een grotere kans op treffers dan het overeenkomstige aangrenzende zaad met hetzelfde gewicht. Een meer gedetailleerde analyse en vergelijking van aaneengesloten en uit elkaar geplaatste zaden wordt gepresenteerd in Ma et al. ( 12).

MegaBLAST (v2.2.4 en later) biedt twee soorten gespreide zaden met verschillende gewichten en spanwijdten: een ontworpen voor coderende regio's, waar een mismatch het vaakst wordt gevonden op de derde codonpositie, en de andere ontworpen voor niet-coderende regio's, waar mismatches worden verondersteld willekeurig te gebeuren. We hebben de exacte kans op treffers berekend voor elk van deze zaden. Voor elke combinatie van gewicht en span had het MegaBLAST-zaad dat is ontworpen voor niet-coderende regio's een hogere hitkans dan het zaad dat is ontworpen voor coderende regio's. Dit is te verwachten, aangezien ons hit-kansmodel ervan uitgaat dat mismatches willekeurig voorkomen. De MegaBLAST-zaden voor niet-coderende regio's zijn echter niet optimaal, d.w.z. in elk geval waren we in staat om verspreide zaden te vinden met hetzelfde gewicht en dezelfde spanwijdte die hogere hitkansen hadden. De zaden die door MegaBLAST worden gebruikt en de optimale zaden samen met de kans op treffers voor een paar uitlijning-lengte-overeenkomstparen worden weergegeven in Tabel 1.


Aanvullende gegevensbestanden

De volgende aanvullende gegevens zijn beschikbaar in de onlineversie van dit document en op [19]. Aanvullend gegevensbestand 1 geeft een volledige lijst van 48.614 transcripten in de PTI die werden weergegeven op de set voorspelde transcriptarrays. Aanvullend gegevensbestand 2 geeft een volledige lijst van 60 weefsels en cellijnen die zijn gehybridiseerd met de voorspelde transcriptarrays. Aanvullend gegevensbestand 3 geeft een lijst van zes weefsels en cellijnen die zijn gehybridiseerd met de genomische tegelarrays van chromosoom 20. Aanvullend gegevensbestand 4 somt de acht weefsels en cellijnen op die zijn gehybridiseerd met de genomische tegelarrays van chromosoom 22. Aanvullend gegevensbestand 5 bevat een vergelijking van EVG-voorspellingen met RefSeq-sequenties (maart 2004). Ook beschikbaar op onze website [19] zijn: verhoudingsgegevens en lichaamsatlasgegevens samen met de EVG-status, en volledige reeksen voor de locusprojecties in fasta-formaat. Alle probe-sequenties en expressiegegevens zijn beschikbaar in de GEO-database [59]. De serie toegangsnummers voor de betegeling en voorspelde transcriptarrays zijn respectievelijk GSE1097 en GSE918.


CS-SCORE: Snelle identificatie en verwijdering van menselijke genoomverontreinigingen uit metagenomische datasets

Metagenomische sequentiegegevens, verkregen van gastheer-geassocieerde microbiële gemeenschappen, zijn meestal besmet met gastheergenoomsequentiefragmenten. Voorafgaand aan het uitvoeren van eventuele stroomafwaartse analyses, is het noodzakelijk om dergelijke verontreinigende sequentiefragmenten te identificeren en te verwijderen. De tijd- en geheugenvereisten van beschikbare detectietechnieken voor hostverontreiniging zijn enorm. Het verwerken van grote metagenomische datasets is dus een uitdagende taak. Deze studie presenteert CS-SCORE - een nieuw algoritme dat snel gastheersequenties kan identificeren die metagenomische datasets vervuilen. Validatieresultaten geven aan dat CS-SCORE 2-6 keer sneller is dan de huidige state-of-the-art methoden. Bovendien ligt de geheugenvoetafdruk van CS-SCORE in het bereik van 2-2,5 GB, wat aanzienlijk lager is dan bij andere beschikbare tools. CS-SCORE bereikt deze efficiëntie door (1) een heuristisch pre-filtermechanisme en (2) een gerichte mapping-benadering op te nemen die gebruik maakt van een nieuwe sequentiesamenstellingsmetriek (cs-scoren). CS-SCORE zal naar verwachting een handig 'pre-processing'-hulpprogramma zijn voor onderzoekers die metagenomische datasets analyseren.


Menselijk genoom project

EEN
verzameling
van
activiteiten
introduceren
nieuwe
gebruikers
tot
de
web
bronnen
Dat
wetenschappers
toegang
tot
leren
wat betreft
genetisch
aandoeningen,
genen,
en
eiwitten.


Om de chromosomen van de Human Genome Landmarks-poster online te bekijken, uw gratis exemplaar van de poster te bestellen of extra exemplaren van dit werkboek te downloaden, gaat u naar de Gene Gateway-website: genomics.energy.gov/genegateway/

Gebruik erfelijke hemochromatose als model om toegang te krijgen tot verschillende websites en databases om • Leren
wat betreft
een
genetisch
wanorde
en
zijn
geassocieerd
gen.
• Identificeren
mutaties
Dat
oorzaak
de
wanorde.
• Vind
de
gen
Aan
een
chromosoom
kaart.
• Onderzoeken
de
genen
volgorde
en
structuur.
• Toegang
de
amino
zuur
volgorde
van
een
genen
eiwit
Product.

• Ontdekken
de
3-‐D
structuur
van
de
genen
eiwit
Product.


De
Gen
poort
Werkboek


Dit
werkboek
was
laatste
bijgewerkt
februari
2011.
Met
veel
waardering,
wij
zou
Leuk vinden
tot
erkennen
Carrie
Morjan,
Aurora
Universiteit,
WHO
gefaciliteerd
de
schepping
van
dit
laatste
versie
door
delen
haar
updates
tot
De
Gen
poort
Werkboek
voor
gebruik maken van
in
haar
genetica
klassen.


Dit
werkboek
was
eerst
geproduceerd
door
de
biologisch
en
Milieu
Onderzoek
Informatie
Systeem
Bij
Eik
Ridge
nationaal
Laboratorium,
Eik
nok,
Tennessee,
juli-
2003,
met
steun
van
de
ONS.
afdeling
van
Energie
Kantoor
van
biologisch
en
Milieu
Onderzoek.


Kantoor
van
biologisch
en
Milieu
Onderzoek
Kantoor
van
Wetenschap
ONS.
afdeling
van
Energie
(DOE)


Dit
werkboek
is
vrij
downloadbaar
van
de
Gen
poort
website
(zien
koppeling
onderstaand).
Voor
vragen
of
opmerkingen
met betrekking tot
dit
document,
contact
Jennifer
Bownas
door
e-mail
Bij
[email protected]


Gen
poort
genomics.energy.gov/genegateway/

Menselijk
genoom
Project
Informatie
www.ornl.gov/hgmis/home.shtml

DOE
genomisch
Wetenschap
Programma

genomicscience.energy.gov

DOE
Kantoor
van
biologisch
en
Milieu
Onderzoek
wetenschap.energie.gov/ber/


ONS.
afdeling
van
Energie
Kantoor
van
biologisch
en
Milieu
Onderzoek


De
Gen
poort
Werkboek

Invoering
. 4
Waarom
Gebruik maken van
Erfgenaam
hemochromatose
als
een
Model?
. 5
Sommige
Basis
concepten
tot
Begrijpen
Voordat
Beginnend
. 5
Werkzaamheid
1
. 6
Online
Mendeliaanse
Erfenis
in
Man
(OMIM)
. 6
GeneTests
. 11
Werkzaamheid
2
. 14
NCBI
Kaart
kijker
. 14
Werkzaamheid
3
. 22
NCBI
Entrez
Gen
en
GenBank
. 22
Werkzaamheid
4
. 32
UniProt
Eiwit
Kennis basis
en
ONTPLOFFING
Zoeken
. 32
Werkzaamheid
5
. 38
Eiwit
Gegevens
bank
. 38
Tafel
van
Standaard
genetisch
Code
voor
vertalen
DNA
Volgorde
Records
.
50
Erfgenaam
hemochromatose
werkblad
. 51


ONS.
afdeling
van
Energie
Kantoor
van
biologisch
en
Milieu
Onderzoek


De
Gen
poort
Werkboek


De
Gen
poort
Werkboek
is
een
verzameling
van
activiteiten
met
schermafbeeldingen
en
stap voor stap
instructies
ontworpen
tot
voorstellen
nieuwe
gebruikers
tot
genetische stoornis
en
bio-informatica
bronnen
vrij
beschikbaar
Aan
de
Web.
Het
zou moeten
nemen
wat betreft
3
uur
tot
compleet
alle
vijf
activiteiten.
De
werkboek
activiteiten
waren
afgeleid van
van
meer
gedetailleerd
gidsen
en
zelfstudies
beschikbaar
Bij
de
Gen
poort
website
(genomics.energy.gov/genegateway/).
Dit
website
was
gemaakt
als
een
hulpbron
voor
aan het leren
meer
wat betreft
de
genen,
eigenschappen,
en
aandoeningen
vermeld
Aan
de
Menselijk
genoom
monumenten
(HGL)
poster,
maar
het
kan
zijn
gebruikt
tot
onderzoeken
ieder
gen
of
genetisch
wanorde
van
interesse.
Veel
gidsen
tot
gebruik makend van
bio-informatica
bronnen
zijn
ontworpen
voor
biowetenschap
onderzoekers
en
zijn
te
technisch
voor
niet-experts.
Dit
werkboek
en
ander
Gen
poort
bronnen
doelwit
een
meer
algemeen
publiek:
leraren,
hoog
school
en
middelbare school
studenten,
patiënten
met
aandoeningen
en
hun
gezinnen,
en
iedereen
anders
WHO
wil
tot
leren
meer
wat betreft
hoe
leven
werken
Bij
een
moleculair
peil.
Dit
werkboek
shows
jij
hoe
tot
krijgen
begonnen
gebruik makend van
bio-informatica
bronnen
Dat
vaak
intimideren
en
overweldigen
nieuwe
gebruikers.
Het
ook
demonstreert
hoe
informatie
van
een
hulpbron,
zo een
als
geannoteerd
eiwit
volgorde
gegevens
van
de
UniProt
Eiwit
Kennis basis,
kan
zijn
gebruikt
tot
versterken
en
verduidelijken
informatie
beschikbaar
van
een ander
hulpbron,
zo een
als
driedimensionaal
(3-‐D)
structuren
van
Eiwit
Gegevens
bank
(VOB).
Gen
poort
voorziet in
gebruikers
met
een
systematische
benadering
tot
gebruik makend van
meerdere
bio-informatica
databases
tot
verdienen
een
beter
begrip
van
hoe
genen
en
eiwitten
kan
bijdrage leveren
tot
de
ontwikkeling
van
een
bijzonder
genetisch
voorwaarde.

Gebruik makend van
de
genetisch
wanorde
erfgenaam
hemochromatose
als
een
model,
dit
werkboek
shows
jij
hoe
tot
toegang:
• • • • • Online
Mendeliaanse
Erfenis
in
Man
(OMIM)
en
GeneReviews
tot
leren
wat betreft
een
genetisch
wanorde,
zijn
geassocieerd
gen
of
genen,
en
gemeenschappelijk
ziekteverwekkend
mutaties.
NCBI
Kaart
kijker
tot
vind
een
gen
locus
Aan
een
chromosoom
kaart.
NCBI
Entrez
Gen
en
GenBank
tot
onderzoeken
de
volgorde
en
structuur
van
een
gen.
UniProt
Eiwit
Kennis basis
tot
vind
de
geannoteerd
amino
zuur
volgorde
van
een
genen
eiwit
Product.
Eiwit
Gegevens
bank
tot
weergave
en
aanpassen
de
3-‐D
structuur
van
de
genen
eiwit
Product.


Vaardigheden
gewonnen
door
werkend
door
de
activiteiten
in
dit
werkboek
kan
zijn
toegepast
tot
aan het leren
wat betreft
ander
genetisch
aandoeningen,
genen,
en
eiwitten.
Dit
werkboek
en
ander
genoom
wetenschap
bronnen
zijn
beschikbaar
van
de
website
voor
de
genoom
programma's
van
de
Kantoor
van
biologisch
en
Milieu
Onderzoek,
ONS.
afdeling
van
Energie
Kantoor
van
Wetenschap
(genomics.energy.gov/).


ONS.
afdeling
van
Energie
Kantoor
van
biologisch
en
Milieu
Onderzoek


De
Gen
poort
Werkboek


Waarom erfelijke hemochromatose als model gebruiken?
• Erfgenaam
hemochromatose,
een
wanorde
in
die
te
veel
ijzer
accumuleert
in
zeker
weefsels
en
organen,
is
veroorzaakt
door
veranderingen
in
de
DNA
volgorde
van
een
enkel
gen,
dus
de
genetisch
basis
van
dit
voorwaarde
is
makkelijker
tot
begrijpen
dan
meer
complex
aandoeningen
veroorzaakt
door
wijzigingen
in
meerdere
genen.
De
gen
en
zijn
eiwit
Product
zijn
naar verhouding
goed
bestudeerd.
Driedimensionaal
structuren
van
de
eiwit
Product
zijn
beschikbaar
in
VOB,
de
Internationale
opslagplaats
voor
macromoleculaire
structuur
gegevens.

Erfgenaam
hemochromatose
is
de
meest
gemeenschappelijk
autosomaal
recessief
wanorde
beïnvloeden
individuen
van
Noordelijk
Europese
herkomst
(wat betreft
1
in
200
Kaukasiërs
ontwikkelen
erfgenaam
hemochromatose).
effectief
methoden
voor
behandeling
zijn
beschikbaar
met
vroeg
diagnose.

Enkele basisconcepten die u moet begrijpen voordat u begint
• Genen
zijn
de
basis
fysiek
en
functioneel
eenheden
van
erfelijkheid.
Elk
gen
is
gelegen
Aan
een
bijzonder
regio
van
een
chromosoom
en
heeft
een
specifiek
besteld
volgorde
van
nucleotiden
(de
gebouw
blokken
van
DNA).
Centraal
dogma
van
moleculair
biologie:
DNA
à
RNA
à
Eiwit
- Genetisch
informatie
is
opgeslagen
in
DNA.

- Segmenten
van
DNA
Dat
coderen
eiwitten
of
ander
functioneel
producten
zijn
genaamd
genen.
- Gene
sequenties
zijn
getranscribeerd
naar binnen
boodschapper
RNA
tussenproducten
(mRNA).
- mRNA
tussenproducten
zijn
vertaald
naar binnen
eiwitten
Dat
presteren
meest
leven
functies.
eukaryotisch
genen
hebben
intronen
en
exonen.
Exons
bevatten
nucleotiden
Dat
zijn
vertaald
naar binnen
amino
zuren
van
eiwitten.
Exons
zijn
uit elkaar gehaald
van
elk
ander
door
tussenbeide komen
segmenten
van
DNA
genaamd
intronen.
Introns
doen
niet
code
voor
eiwit,
en
zij
zijn
VERWIJDERD
wanneer
eukaryoot
mRNA
is
verwerkt.
Exons
zijn
gesplitst
rug
samen
tot
formulier
de
intron-‐vrij
mRNA
strand
Dat
is
gebruikt
als
een
sjabloon
tot
maken
eiwitten.

Speciaal
mobiel
componenten
(ribosomen)
gebruik maken van
de
drieling
genetisch
code
tot
vertalen
de
nucleotiden
van
een
mRNA
volgorde
naar binnen
de
amino
zuur
volgorde
van
een
eiwit.
EEN
Tafel
van
Standaard
genetisch
Code
is
mits
Aan
bladzijde
50
van
dit
werkboek.
Daar
zijn
20
verschillend
amino
zuren.
Eiwitten
zijn
gemaakt
door
linken
amino
zuren
samen
in
een
lineair
mode
tot
formulier
polypeptide
kettingen.
Zien
de
Tafel
van
Standaard
genetisch
Code
Aan
bladzijde
50
voor
enkele letter
en
drieletterig
afkortingen
voor
de
20
verschillend
amino
zuren.
Polypeptide
kettingen
vouw
naar binnen
3-‐D
structuren
Dat
kan
associëren
met
ander
moleculair
structuren
tot
presteren
specifiek
functies.


ONS.
afdeling
van
Energie
Kantoor
van
biologisch
en
Milieu
Onderzoek


De
Gen
poort
Werkboek


Activiteit 1
Online bronnen: OMIM en GeneTests • Leer meer over de genetische aandoening en het bijbehorende gen. • Identificeer mutaties die de aandoening veroorzaken.

Online Mendeliaanse overerving bij de mens (OMIM)
OMIM
is
een
uitgebreide
database
van
menselijk
genen,
genetisch
eigenschappen,
en
aandoeningen
gemaakt
door
onderzoekers
Bij
Johns
Hopkins
Universiteit.
De
OMIM
databank,
die
is
bijgewerkt
dagelijks,
is
toegankelijk
door
de
nationaal
Centrum
voor
Biotechnologie
Informatie
(NCBI)
suite
van
online
bronnen.
Elk
dossier
in
OMIM
vat samen
de
lichaam
van
Onderzoek
relevant
tot
een
bijzonder
gen,
karaktereigenschap,
of
wanorde.

Tot
toegang
OMIM,
laten we
Gaan
tot
de
NCBI
huis
bladzijde
(www.ncbi.nlm.nih.gov)
getoond
onderstaand,
en
dan
Klik
Aan
OMIM
in
de
doos
Aan
de
bovenste
Rechtsaf.


EEN
schermafbeelding
van
de
OMIM
huis
bladzijde
is
getoond
Aan
de
volgend op
bladzijde.
De
gemakkelijkste
manier
tot
beginnen
een
zoeken
is
tot
gewoon
type
een
wanorde
naam
in
de
zoeken
doos
Bij
de
bovenkant
van
de
OMIM
bladzijde
en
indienen
jouw
zoeken.
Echter,
NCBI
ook
ondersteunt
een
verscheidenheid
van
Kenmerken
voor
vernauwing
een
zoeken
en
browsen
aandoeningen
alfabetisch
(gebruik makend van
OMIM
Morbide
Kaart)
of
door
chromosomaal
plaats
(gebruik makend van
OMIM
Gen
Kaart).
Tot
smal
een
zoeken,
NCBI
heeft
opties
voor
typen
zoeken
veld
kwalificaties
naar binnen
de
zoeken
doos
[zien
OMIM
Helpen
(www.ncbi.nlm.nih.gov/Omim/omimhelp.html)
voor
meer
informatie]
of
selecteren
zoeken
velden
gebruik makend van
de
Limieten
tabblad.
Dit
oefening
zullen
tonen
zoekopdrachten
gebruik makend van
de
Limieten
tabblad.


ONS.
afdeling
van
Energie
Kantoor
van
biologisch
en
Milieu
Onderzoek


De
Gen
poort
Werkboek


1. Selecteer
de
Limieten
tabblad
Bij
de
bovenkant
van
de
OMIM
bladzijde
getoond
in
de
schermafbeelding
onderstaand.


URL
voor
OMIM
huis
bladzijde:
www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=OMIM


Meest
genen,
aandoeningen
en
eigenschappen
vermeld
Aan
de
Menselijk
genoom
monumenten
(HGL)
poster
waren
genomen
van
de
titel
velden
van
OMIM
verslagen,
dus
wij
kan
smal
ons
zoeken
tot
kijk
enkel en alleen
voor
die
records
Dat
hebben
"hemochromatose"
in
de
titel
veld.
Door
selecteren
"hemochromatose"
van
de
HGL
poster,
wij
ook
weten
Dat
de
gen
voor
dit
wanorde
is
gevonden
Aan
chromosoom
6.

2. Van
de
Limieten
bladzijde,
binnenkomen
hemochromatose
naar binnen
de
zoeken
doos
en
selecteer
de
Titel
doos
en
chromosoom
6
als
getoond
in
de
schermafbeelding
onderstaand.
Klik
Gaan
tot
indienen
jouw
zoeken.

ONS.
afdeling
van
Energie
Kantoor
van
biologisch
en
Milieu
Onderzoek


De
Gen
poort
Werkboek


OPMERKING:
Zoeken
voor
OMIM
records
geassocieerd
met
multi-genen
aandoeningen,
zo een
als
borst
kanker
of
suikerziekte,
die
zijn
veroorzaakt
door
wijzigingen
in
genen
Aan
verschillend
chromosomen,
kunnen
voorzien in
meerdere
OMIM
records
in
de
zoeken
resultaten.
beperken
jouw
zoeken
tot
alleen maar
een
chromosoom
voor
een
multi-genen
wanorde
kunnen
enkel en alleen
uittreden
een
subgroep
van
alle
de
records
geassocieerd
met
Dat
wanorde.


3. De
zoeken
zou moeten
opbrengst
een
resultaat:
MIM
ID kaart
#235200.
EEN
schermafbeelding
van
de
vol
OMIM
dossier
voor
de
hemochromatose
wanorde
is
getoond
onderstaand.


4. Laten we
onderzoeken
sommige
van
de
Kenmerken
van
dit
dossier:
• Elk
OMIM
dossier
is
toegewezen
een
uniek
zes-cijferig
MIM
ID kaart
nummer
gelegen
Bij
de
bovenkant
van
elk
binnenkomst.
Voor
hemochromatose,
de
MIM
ID kaart
is
235200.
Als
een
uniek
identificatie
voor
een
wanorde,
de
MIM
ID kaart
kan
zijn
gebruikt
tot
zoeken
ander
databases
voor
informatie
wat betreft
een
bijzonder
wanorde.

De
nummer
teken
(#)
voorvoegsel
in
voorkant
van
de
MIM
ID kaart
middelen
Dat
dit
binnenkomst
verwijst naar
tot
de
Omschrijving
van
een
fenotype,
en
de
moleculair
basis
voor
dit
fenotype
is
bekend.
Voor
meer
informatie
wat betreft
ander
MIM
nummer
voorvoegsels,
zien
OMIM
Helpen
(www.ncbi.nlm.nih.gov/Omim/omimhelp.html#MIMnumberPrefix).
Onderstaand
de
MIM
ID KAART,
jij
zullen
vind
de
wanorde
naam
en
de
officieel
gen
symbool
(weergegeven)
in
de
afbeelding
Aan
de
De volgende
bladzijde).
De
officieel
gen
symbool,
die
is
HFE
voor
hemochromatose,
serveert
als
een
uniek
identificatie
voor
een
gen.
Tot
zijn
"officieel,"
een
gen
symbool
moeten
hebben
geweest
goedgekeurd
door
de
HUGO
Gen
Nomenclatuur
Commissie
(www.genenames.org).
De
gen

ONS.
afdeling
van
Energie
Kantoor
van
biologisch
en
Milieu
Onderzoek


De
Gen
poort
Werkboek


symbool
is
vooral
bruikbaar
wanneer
zoeken
ander
databases
(zo een
als
volgorde,
genoom-‐ mapping,
en
structuur
databanken)
voor
gen-‐specifiek
informatie.

OPMERKING:
Voor
een
wanorde
Leuk vinden
hemochromatose,
die
is
in de eerste plaats
veroorzaakt
door
mutaties
in
een
enkel
gen,
de
officieel
gen
symbool
kunnen
zijn
inbegrepen
in
de
dossier
titel.
Voor
complex
aandoeningen
Leuk vinden
borst
kanker,
officieel
symbolen
voor
geassocieerd
genen
zullen
zijn


beschreven
in
de
eerst
paragraaf
van
tekst.

De
Gen
kaart
locus
beschrijft
waar
een
gen
kan
zijn
gevonden
Aan
een
chromosoom.
Voor
de
gen
locus
6p21.3,
6
is
de
chromosoom
nummer,
P
geeft aan
de
kort
arm
van
de
chromosoom,
en
21.3
is
een
nummer
toegewezen
tot
een
bijzonder
regio
van
de
chromosoom.
Klikken op
Aan
een
gen
kaart
locus
opent
de
OMIM
Gen
Kaart,
een
tafel
van
genen
georganiseerd
door
chromosomaal
plaats.
De
hoeveelheid
van
tekst
binnenin
een
OMIM
dossier
varieert
volgens
tot
wat
is
bekend
wat betreft
een
bijzonder
gen,
wanorde,
of
karaktereigenschap.
Sinds
hemochromatose
is
goed
bestudeerd,
een
kavel
van
informatie
is
bekend
wat betreft
dit
wanorde
en
zijn
gen.
Sommige
verschillend
types
van
informatie
Dat
kunnen
zijn
inbegrepen
in
een
OMIM
dossier
zijn
wanorde
Omschrijving,
erfenis,
moleculair
genetica,
genotype
en
fenotype
correlaties,
diagnose,
bevolking
genetica,
en
dier
modellen.

Elk
dossier
omvat
een
Tafel
van
Inhoud
doos
Aan
de
Rechtsaf
met
snel
links
tot
verschillend
secties
binnenin
de
dossier.

5. Om
leren
meer
wat betreft
de
moleculair
basis
van
hemochromatose,
selecteer
de
moleculair
Genetica
koppeling
in
de
Tafel
van
Inhoud
doos
(zien
schermafbeelding
Aan
vorig
bladzijde).
De
moleculair
Genetica
sectie
van
de
OMIM
dossier
voor
hemochromatose
is
getoond
onderstaand.


• Een
studie
liet zien
Dat
wat betreft
83%
van
hemochromatose
gevallen
zijn
verwant
tot
de
C282Y
mutatie.
De
“C282Y”
notatie
middelen
Dat
een
mutatie
komt voor
in
de
DNA
volgorde
Dat
veranderingen
de
amino
zuur
Bij
positie
282
in
de
eiwit
Product
van
een
cysteïne
(C)
tot
een
tyrosine
(T).


6. Klik op
Aan
de
eerst
koppeling
voor
de
C282Y
mutatie,
613609.0001.
Dit
koppeling
zullen
nemen
jij
tot
de
OMIM
dossier
voor
de
HFE
gen
(MIM
ID kaart
*613609
de
asterisk
voorvoegsel
geeft aan
de
dossier
vertegenwoordigt
een
gen
van
bekend
volgorde).
OMIM
vaak
onderhoudt
verschillend
records
voor


ONS.
afdeling
van
Energie
Kantoor
van
biologisch
en
Milieu
Onderzoek


De
Gen
poort
Werkboek


fenotypes
(zo een
als
de
wanorde
hemochromatose)
en
de
genen
geassocieerd
met
die
fenotypen.
7. De
Allelisch
varianten
sectie
van
de
OMIM
dossier
voor
de
HFE
gen
is
getoond
in
de
schermafbeelding
onderstaand.
Dit
sectie
typisch
beschrijft
sommige
van
de
meest
opmerkelijk
gen
mutaties
(ook
genaamd
allelisch
varianten)
Dat
produceren
ziekte
fenotypen.
Opmerking
Dat
de
C282Y
mutatie
is
ook
bekend
als
de
CYS282TYR
mutatie,
en
het
is
de
eerst
van
meerdere
mutaties
Dat
hebben
geweest
geïdentificeerd
voor
de
HFE
gen.
Tot
zien
een
vermelding
van
de
verschillend
mutaties
voor
de
HFE
gen,
Klik
Aan
de
"Zien
allelisch
varianten
in
tabelvorm
Scherm"
koppeling.


8. Nu
jij
zijn
klaar
tot
antwoord geven
Vragen
1–2
voor
Werkzaamheid
1
in
de
werkblad
Aan
bladzijde
51.

9. Scrollen
tot
de
bovenkant
van
dit
OMIM
dossier,
en
Klik
Aan
de
Limieten
tabblad.
Laten we
gebruik maken van
opties
Aan
de
Limieten
bladzijde
tot
bepalen
hoe
veel
genen
in
de
menselijk
genoom
hebben
geweest
beschreven
in
OMIM.

• • Schakel het vinkje uit
de
dozen
voor
Titel
en
chromosoom
6.

Rekening
de
dozen
naast
de
MIM
Nummer
Voorvoegsel
opties
voor
*
gen
met
bekend
volgorde
en
+
gen
met
bekend
volgorde
en
fenotype
als
getoond
in
de
schermafbeelding
Aan
de
De volgende
bladzijde.

Vervolgens
Klik
de
Gaan
knop
naast
de
zoeken
doos
Bij
de
bovenkant
van
de
bladzijde.


ONS.
afdeling
van
Energie
Kantoor
van
biologisch
en
Milieu
Onderzoek


De
Gen
poort
Werkboek


10. Jij
zou moeten
uittreden
over
13,500
zoeken
resultaten.
Van
de
geschatte
20,000
tot
25,000
genen
in
de
menselijk
genoom,
wat betreft
13,500
genen
hebben
records
in
OMIM.
Jij
kunnen
wil
tot
toets
jouw
nieuwe
zoeken
vaardigheden
door
gebruik makend van
OMIM
tot
zoeken
voor
ander
genen
of
genetisch
voorwaarden.
In
toevoeging
tot
OMIM,
een ander
Goed
hulpbron
voor
aan het leren
wat betreft
genetisch
aandoeningen
en
geassocieerd
genen
is
de
GeneTests
website,
die
is
beschreven
in
de
De volgende
deel
van
dit
werkzaamheid.


GeneTests
De
GeneTests
website
is
een
medisch
genetica
informatie
hulpbron
ontwikkelde
door
onderzoekers
en
gezondheidszorg
professionals
en
gefinancierd
door
de
nationaal
instituten
van
Gezondheid.
In
toevoeging
tot
het verstrekken van
actueel,
gezaghebbend
rapporten
(GeneReviews)
Aan
genetisch
aandoeningen,
de
website
ook
omvat
leerzaam
materialen
(bijv.
feit
lakens
Aan
genetisch
testen
en
advies,
Power Point
dia's,
en
een
geïllustreerd
woordenlijst)
en
online
mappen
van
genetisch
laboratoria
en
klinieken.

Dit
werkzaamheid
focust
Aan
toegang krijgen tot
en
gebruik makend van
genetisch
wanorde
informatie
beschikbaar
van
GeneReviews.
Alle
inzendingen
zijn
geschreven
en
beoordeeld
door
artsen,
dus
de
taal
is
vergelijkbaar
tot
Dat
van
medisch
tekst.
Terwijl
de
hoeveelheid
en
vriendelijk
van
inhoud
kan
variëren
enorm
van
dossier
tot
dossier
in
OMIM,
alle
rapporten
in
GeneReviews
zullen
voorzien in
vergelijkbaar
soorten
van
informatie
en
deel
de
dezelfde
organisatorisch
structuur.

Laten we
Gaan
tot
de
GeneTests
website
(www.genetests.org)
tot
vind
een
GeneReview
voor
erfgenaam
hemochromatose.
De
schermafbeelding
van
de
GeneTests
huis
bladzijde
is
getoond
Aan
de
De volgende
bladzijde.


ONS.
afdeling
van
Energie
Kantoor
van
biologisch
en
Milieu
Onderzoek


De
Gen
poort
Werkboek


2. At
de
GeneReviews
zoeken
bladzijde
(weergegeven)
onderstaand),
gebruik maken van
de
Gen
Symbool
zoeken
optie,
selecteer
precies
wedstrijden
van
de
vervolgkeuzelijst
menu,
en
binnenkomen
HFE
naar binnen
de
zoeken
doos.
Klik
Gaan
tot
indienen
jouw
zoeken.

ONS.
afdeling
van
Energie
Kantoor
van
biologisch
en
Milieu
Onderzoek


De
Gen
poort
Werkboek


3. Naast
de
zoeken
resultaat
“HFE-‐Geassocieerd
Erfgenaam
hemochromatose,”
selecteer
de
koppeling
tot
toegang
de
erfgenaam
hemochromatose
beoordeling
getoond
onderstaand.



4. Aan
de
Rechtsaf
kant
van
de
scherm
is
een
navigatie
kolom
met
links
tot
verschillend
secties
van
de
HFE-‐Geassocieerd
Erfgenaam
hemochromatose
GeneReview.
5. Toegang
de
Samenvatting
sectie
tot
leren
wat betreft
ziekte
kenmerken
en
behandeling
voor
hemochromatose.
Dit
sectie
kan
helpen
antwoord geven
Vraag
3
voor
Werkzaamheid
1
in
de
werkblad
Aan
bladzijde
51.
6. Toegang
de
moleculair
Genetica
sectie
voor
een
kort
Overzicht
van
dit
stoornis
moleculair
basis.
Binnenin
dit
sectie
jij
kan
vind
informatie
wat betreft:
• officieel
symbool
voor
de
gen
geassocieerd
met
dit
wanorde.

• chromosoom
locus
van
de
gen.
• gen
maat
en
de
nummer
van
exonen
in
de
gen.

• naam
van
de
genen
eiwit
Product.

• Omschrijving
van
de
eiwitten
functie.

• mutaties
in
nucleotide
en
amino
zuur
sequenties
Dat
oorzaak
abnormaal
eiwit
producten
en
ziekte
fenotypen.

• koppelingen
tot
wetenschappelijk
literatuur
en
ander
databases
voor
meer
informatie.


ONS.
afdeling
van
Energie
Kantoor
van
biologisch
en
Milieu
Onderzoek


De
Gen
poort
Werkboek


Activiteit 2
Online bron: NCBI Map Viewer • Vind het erfelijke hemochromatose-gen op een chromosoomkaart.

NCBI-kaartviewer
NCBI
Kaart
kijker
is
een
Webgebaseerd
hulpmiddel
voor
bekijken
en
zoeken
een
organisme
compleet
genoom.
Gebruikers
ook
kan
weergave
kaarten
van
individueel
chromosomen
en
zoom
in
tot
specifiek
Regio's
binnenin
chromosomen
tot
ontdekken
de
genoom
Bij
de
volgorde
peil.

Kaart
kijker
voorziet in
toegang
tot
meerdere
verschillend
types
van
kaarten
voor
verschillend
organismen.
Veel
van
deze
kaarten
zijn
betekenisvol
enkel en alleen
tot
wetenschappelijk
onderzoekers.
EEN
discussie
van
alle
de
verschillend
types
van
kaarten
en
genomisch
gegevens
is
voorbij
de
domein
van
dit
werkzaamheid,
die
zullen
focus
enkel en alleen
Aan
hoe
tot
bevind zich
een
specifiek
gen
locus
Aan
een
chromosoom
kaart.
1. Ga
tot
de
NCBI
Kaart
kijker
website
(www.ncbi.nlm.nih.gov/mapview/).
In
de
lijst
van
primaten,
Klik
Aan
de
Bouwen
37.2
koppeling
voor
Homo
sapiens
(menselijk).



ONS.
afdeling
van
Energie
Kantoor
van
biologisch
en
Milieu
Onderzoek


De
Gen
poort
Werkboek


2. De
Kaart
kijker
bladzijde
voor
de
geheel
menselijk
genoom
is
getoond
in
de
schermafbeelding
onderstaand.


Homo
sapiens
genoom
weergave:
www.ncbi.nlm.nih.gov/mapview/map_search.cgi?taxid=9606

3. In
Werkzaamheid
1,
wij
geleerd
Dat
de
officieel
symbool
voor
de
erfgenaam
hemochromatose
gen
is
HFE,
en
zijn
locus
is
6p21.3.
Laten we
vind
de
HFE
gen
Aan
chromosoom
6.


De
locus
voor
een
bijzonder
gen
beschrijft
de
regio
van
een
chromosoom
waar
Dat
gen
kan
zijn
gevonden.
Voor
de
6p21.3
plaats:
6
is
de
chromosoom
nummer,
P
geeft aan
de
kort
arm
van
de
chromosoom,
en
21.3
is
de
nummer
toegewezen
tot
een
bijzonder
band
of
regio
Aan
een
chromosoom.
Wanneer
chromosomen
zijn
bevlekt
in
de
laboratorium,
licht
en
donker
bands
verschijnen,
en
elk
band
is
genummerd.
De
hoger
de
nummer,
de
verder
weg
de
band
is
van
de
centromeer.
EEN
locus
bevattende
Q
is
gevonden
Aan
de
lang
arm
van
een
chromosoom.


4. In
de
zoeken
doos
Bij
de
bovenkant
van
de
Kaart
kijker
bladzijde,
binnenkomen
HFE[sym]
en
dan
Klik
de
Vind
knop
tot
indienen
jouw
zoeken.
Toevoegen
de
[sym]
zoeken
veld
kwalificatie:
tot
de
einde
van
jouw
zoeken
termijn
specificeert
jouw
vraag
dus
Dat
enkel en alleen
die
resultaten
bevattende
de
HFE
gen
zijn
opgehaald.

ONS.
afdeling
van
Energie
Kantoor
van
biologisch
en
Milieu
Onderzoek


De
Gen
poort
Werkboek


5. Rood
Kruis aan
merken
zou moeten
zijn
weergegeven
Aan
chromosoom
6,
wijzend op
de
bij benadering
plaats
van
de
HFE
gen
in
de
midden-
van
de
kort
arm
van
chromosoom
6
(zien
schermafbeelding
onderstaand).
De
rood
nummer
(“61”)
etiketteren
chromosoom
6
geeft aan
de
nummer
van
voorwerpen
in kaart gebracht
tot
verschillend
assemblages
van
de
menselijk
genoom
Dat
erbij betrekken
de
HFE
gen.



6. Klik op
Aan
de
nummer
6
koppeling
onderstaand
de
chromosoom.
Dit
zullen
open
een
weergave
van
chromosoom
6
Dat
zou moeten
kijk
Leuk vinden
de
schermafbeelding
onderstaand.
In
de
De volgende
stap
wij
zullen
aanpassen
dit
weergave
dus
wij
kan
zien
een
ideogram
laten zien
de
regio
van
chromosoom
6
waar
de
HFE
gen
kan
zijn
gevonden.

ONS.
afdeling
van
Energie
Kantoor
van
biologisch
en
Milieu
Onderzoek


De
Gen
poort
Werkboek


7. Om
aanpassen
de
Scherm
opties,
Klik
Aan
de
Kaarten
&
Opties
knop
in
de
bovenste
Rechtsaf
hoek.
Dit
zullen
open
een
raam
voor
aanpassen
kaart
opties.
Maken
de
volgend op
aanpassingen.

• • Verwijderen
alle
kaarten
vermeld
onder
Kaarten
Weergegeven
(links
tot
Rechtsaf)
behalve
de
Gen
kaart.
Tot
verwijderen
een
kaart,
selecteer
het
met
jouw
muis
en
dan
Klik
de
VERWIJDEREN
knop.

Onder
Beschikbaar
Kaarten
selecteer
ideogr
(jij
zullen
nodig hebben
tot
rol
door
meer
dan
voor de helft
van
de
beschikbaar
kaarten)
en
dan
Klik
de
TOEVOEGEN
knop.
De
ideogram
kaart
is
een
grafisch
laten zien
de
banding
patroon
van
een
chromosoom.
De
Kaarten
Weergegeven
lijst
zou moeten
kijk
Leuk vinden
de
schermafbeelding
onderstaand.
De
Gen
kaart
zou moeten
zijn
toegewezen
als
jouw
meester
kaart.
Tot
maken
een
kaart
de
meester,
selecteer
het
met
jouw
muis
en
dan
Klik
de
Maken
Meester/Verplaats
tot
Onderkant
knop.
In
de
chromosoom
weergave,
een
meester
kaart
is
getoond
Bij
de
Rechtsaf
kant
van
de
scherm
langs
met
zijn
details
en
beschrijvend
tekst.
De
Gen
kaart
omvat
links
voor
aan het leren
meer
wat betreft
de
genen
in kaart gebracht
tot
een
bijzonder
regio
van
genomisch
volgorde
Aan
een
chromosoom.
Onder
Meer
Opties
in de buurt
de
onderkant
van
de
raam,
verandering
Bladzijde
Lengte
van
30
tot
10.
De
Bladzijde
Lengte
optie
is
gemarkeerd
in
de
schermafbeelding
onderstaand.
Dit
zullen
aanpassen
de
hoogte
van
de
weergegeven
kaart.

Voordat
jij
Klik
de
Oke
knop
tot
indienen
jouw
veranderingen,
de
opties
raam
zou moeten
lijken
de
schermafbeelding
onderstaand.

8. De
nieuwe
kaart
van
chromosoom
6
zou moeten
lijken
de
schermafbeelding
Aan
de
De volgende
bladzijde.



ONS.
afdeling
van
Energie
Kantoor
van
biologisch
en
Milieu
Onderzoek


De
Gen
poort
Werkboek


9. Controleer
uit
sommige
van
Kaart
Kijkers
Kenmerken
weergegeven
in
de
schermafbeelding
bovenstaand.
• De
deel
van
chromosoom
6
weergegeven
in
Kaart
kijker
is
gemarkeerd
Aan
de
ideogram
in
de
blauw
navigatie
kolom
Aan
de
links.
Kennisgeving
Dat
de
rood
markering
wijzend op
de
positie
van
de
HFE
gen
lijnen
omhoog
met
de
ideogram
Bij
de
6p22
chromosoom
band,
niet
6p21.3.

afgerond
tot
de
dichtstbijzijnde
duizendste,
de
regio
van
volgorde
weergegeven
begint
Bij
wat betreft
de
26.086.000ste
nucleotide
en
loopt af
Bij
wat betreft
de
26.100.000ste
nucleotide
van
de
DNA
volgorde
van
chromosoom
6.
De
totaal
DNA
volgorde
voor
chromosoom
6
is
wat betreft
171
miljoen
baseren
paren
lang,
maar
dit
weergave
enkel en alleen
shows
wat betreft
14,000
baseren
paren.
Klikken op
Aan
de
Ideogram
of
Genes_seq
kaarten
(niet
de
etiketten)
zullen
open
een
pop-up
raam
met
opties
voor
zoomen
in
of
uit
Aan
de
weergegeven
kaarten.
Kaart
kijker
heeft
ingezoomd
in
dus
veel
tot
laten zien
de
HFE
gen,
daar
is niet
veel
van
de
ideogram
kaart
weergegeven.
Jij
kan
ook
zoom
in
en
uit
gebruik makend van
de
zoom
optie
in
de
blauw
navigatie
kolom.

De
Genes_seq
kaart
voorziet in
links
tot
gen-‐specifiek
inzendingen
in
ander
NCBI
databanken.

o o HFE

Links
tot
de
HFE
binnenkomst
in
de
Entrez
Gen
databank,
een
compendium
van
genen
en
in kaart gebracht
fenotypen.

OMIM

Links
tot
de
hemochromatose
binnenkomst
in
de
Online
Mendeliaanse
Erfenis
in
Man
(OMIM)
database
bedekt
in
Werkzaamheid
1.

ONS.
afdeling
van
Energie
Kantoor
van
biologisch
en
Milieu
Onderzoek


De
Gen
poort
Werkboek

HGNC

Links
tot
de
gen
symbool
verslag doen van
onderhouden
door
de
HUGO
Gen
Nomenclatuur
Commissie.

sv –
Links
tot
Volgorde
kijker,
een
grafisch
koppel
voor
onderzoeken
de
genen
volgorde
als
goed
als
genomisch
volgorde
stroomopwaarts
en
stroomafwaarts
van
de
gen.

pr

Links
tot
volgorde
records
voor
de
genen
eiwit
Product
onderhouden
in
NCBI's
Eiwit
databank.

dl

Links
tot
een
bladzijde
voor
downloaden
de
bereik
van
volgorde
gegevens
weergegeven
in
Kaart
kijker.
ev

Links
tot
Bewijs
kijker,
een
hulpmiddel
voor
vinden
biologisch
bewijs
Dat
ondersteunt
een
bijzonder
gen
model-
en
voor
verkennen
de
verschillend
types
van
uitgedrukt
sequenties
Dat
uitlijnen
tot
een
bijzonder
Oppervlakte
binnenin
een
genoom.
mm

Links
tot
Model
Maker,
een
hulpmiddel
voor
gebouw
jouw
eigen
versie
van
een
gen
model-
door
toevoegen
of
Verwijderen
exonen.
hm

Links
tot
homologen,
een
hulpbron
voor
vergelijken
genen
in
homoloog
segmenten
van
DNA
van
verschillend
organismen.
st

Links
tot
UniSTS,
een
uitgebreide
database
Dat
integreert
genetisch
markeerstift
en
in kaart brengen
informatie.
EEN
volgorde
getagd
website
(STS)
is
een
kort
(200
tot
500
baseren
paren)
DNA
volgorde
Dat
heeft
een
enkel
voorval
in
de
menselijk
genoom.
detecteerbaar
door
polymerase
ketting
reactie
(PCR),
STS
zijn
bruikbaar
voor
lokaliseren
en
oriënteren
de
volgorde
gegevens
gemeld
van
veel
verschillend
laboratoria.

CCDS

Links
tot
de
CCDS
projecteren,
een
poging
tot
ervoor zorgen
Dat
codering
Regio's
binnenin
de
menselijk
genoom
zijn
consequent
geannoteerd.

SNP

Links
tot
records
voor
enkel
nucleotide
polymorfismen
(SNP's)
en
ander
gebieden
van
volgorde
variatie
Dat
hebben
geweest
geïdentificeerd
in
de
geselecteerd
gen.

10. Laten we
zoom
uit
tot
weergave
de
geheel
chromosoom
gebruik makend van
de
Kaarten
&
Opties
raam.

• • • Klik
Aan
Kaarten
&
Opties
opnieuw
tot
open
de
opties
raam.

Verwijderen
de
nummers
definiërend
de
Regio
getoond
Bij
de
bovenkant
van
de
opties
raam.
Dit
zullen
aanpassen
de
Scherm
dus
het
shows
de
geheel
chromosoom.
Onder
Meer
Opties
in de buurt
de
onderkant
van
de
raam,
verandering
Bladzijde
Lengte
van
10
tot
20.
De
Bladzijde
Lengte
optie
is
gemarkeerd
in
de
schermafbeelding
Aan
de
De volgende
bladzijde.
Dit
zullen
Scherm
20
gelabeld
genen
in
de
meester
kaart
en
zou moeten
voorzien in
genoeg
ruimte
Aan
de
scherm
tot
weergave
de
geheel
chromosoom
met
leesbaar
etiketten
voor
de
chromosoom
banden.

Een keer
de
Kaarten
&
Opties
raam
lijkt op
de
schermafbeelding
Aan
de
volgend op
bladzijde,
Klik
de
Oke
knop
tot
indienen
jouw
veranderingen.

ONS.
afdeling
van
Energie
Kantoor
van
biologisch
en
Milieu
Onderzoek


De
Gen
poort
Werkboek


11. Jouw
weergave
van
chromosoom
6
zou moeten
lijken
de
schermafbeelding
Aan
de
De volgende
bladzijde.

• Tot
zien
een
meer
uitgebreide
vermelding
van
genen
Aan
chromosoom
6,
selecteer
de
Gegevens
Als
Tafel
Weergave
koppeling
in
de
blauw
navigatie
kolom
Aan
de
links.
De
Gegevens
Als
Tafel
Weergave
toont
1,000
van
de
genen
Aan
chromosoom
6
en
shows
waar
genen
begin
en
stop
in
de
chromosoom's
DNA
volgorde.
Rol
omlaag
tot
de
onderkant
van
de
kaart
tot
onderzoeken
de
Samenvatting
van
Kaarten
sectie.
Gebruik maken van
dit
informatie
en
wat
jij
hebben
geleerd
wat betreft
Kaart
kijker
tot
antwoord geven
de
Vragen
voor
Werkzaamheid
2
Aan
bladzijde
51.


ONS.
afdeling
van
Energie
Kantoor
van
biologisch
en
Milieu
Onderzoek


De
Gen
poort
Werkboek


ONS.
afdeling
van
Energie
Kantoor
van
biologisch
en
Milieu
Onderzoek


De
Gen
poort
Werkboek


Activiteit 3
Online bronnen: NCBI Entrez Gene en GenBank • Onderzoek gensequentie en structuur.

NCBI Entrez Gene en GenBank
Entrez
Gen
is
een
NCBI
hulpbron
Dat
serveert
als
een
single-‐query
koppel
voor
toegang krijgen tot
volgorde
en
ander
biologisch
informatie
voor
specifiek
genen
van
een
verscheidenheid
van
gesequenced
organismen.
GenBank
is
NCBI's
uitgebreide
opslagplaats
van
geannoteerd
DNA
sequenties.

Dit
werkzaamheid
covers
hoe
tot
gebruik maken van
Entrez
Gen
tot
toegang
de
genomisch
DNA
volgorde
van
de
erfgenaam
hemochromatose
(HFE)
gen.
Vervolgens
door
onderzoeken
sommige
verschillend
Kenmerken
van
een
GenBank
dossier
voor
de
HFE
gen,
wij
zullen
leren
wat betreft
de
genen
structuur
(bijv.
intron
en
exon
samenstelling,
codering
volgorde).
1. Om
beginnen,
laten we
Gaan
tot
de
Entrez
Gen
huis
bladzijde
(www.ncbi.nlm.nih.gov/gene).
In
de
zoeken
doos
Bij
de
bovenkant,
binnenkomen
HFE[sym]
EN
mens[orgn]
als
getoond
in
de
schermafbeelding
onderstaand.
Zijn
zeker
tot
hoofdletters
ieder
Booleaans
operator
(EN,
OF,
en
NIET)
inbegrepen
in
jouw
zoeken
verklaringen.
Vervolgens
indienen
jouw
zoeken.


ONS.
afdeling
van
Energie
Kantoor
van
biologisch
en
Milieu
Onderzoek


De
Gen
poort
Werkboek


Zoeken
Tip:
Toevoegen
[sym]
tot
de
einde
van
jouw
vraag
termijn
vertelt
Entrez
Gen
Dat
jij
zijn

zoeken
door
gen
symbool
enkel en alleen.
Indien
jij
doen
niet
specificeren
Dat
jij
wil
tot
zoeken
de
gen
symbool
veld,
de
zoeken
zullen
opbrengst
meerdere
records
Dat
erbij betrekken
de
vraag
termijn
overal
binnenin
een
record's
inhoud.
Toevoegen
[orgn]
tot
een
zoeken
termijn
limieten
de
zoeken
tot
genen
van
een
specifiek
organisme.
Voor
meer
informatie
Aan
opties
voor
verfijnen
jouw
zoeken,
zien
de
Zoeken
Veld
Beschrijvingen
en
Kwalificaties
sectie
van
de
Entrez
Helpen
Document
(www.ncbi.nlm.nih.gov/entrez/query/static/help/Summary_Matrices.html).

2. Indienen
dit
zoeken
zou moeten
uittreden
een
enkel
resultaat.
De
HFE
dossier
is
getoond
onderstaand.


3. In
de
Samenvatting
sectie
jij
kan
vind
informatie
wat betreft
de
functie
van
de
genen
eiwit
Product.
De
HFE
eiwit
is
gedachte
tot
hebben
een
rol
in
regulerend
ijzer
vervoer-
naar binnen
cellen,
en
gebreken
in
de
HFE
gen
kan
oorzaak
de
ijzer
absorptie
wanorde
erfgenaam
hemochromatose.
Gebruik maken van
informatie
mits
in
de
Samenvatting
sectie
tot
antwoord geven
Vraag
1
voor
Werkzaamheid
3
in
de
werkblad
Aan
bladzijde
52.


ONS.
afdeling
van
Energie
Kantoor
van
biologisch
en
Milieu
Onderzoek


De
Gen
poort
Werkboek


4. Hieronder
de
samenvatting
sectie
is
de
genomisch
Regio's,
transcripties,
en
producten
sectie.

• De
volgorde
kijker
doos
shows
een
grafisch
model-
van
de
HFE
gen
bestaande uit
van
een
dun
grijs
lijn
(representatief
intronen
Dat
zijn
VERWIJDERD
wanneer
de
mRNA
is
verwerkt)
verbonden
tot
dikker
groente
dozen
(representatief
exonen).

De
deel
van
de
chromosoom
6
volgorde
inbegrepen
in
de
volgorde
kijker
doos
is
dat is genoteerd
in
de
bovenste
links
hoek.
Klik
Aan
de
GenBank
koppeling
in
de
bovenste
Rechtsaf
hoek
tot
toegang
de
GenBank
dossier
voor
de
HFE
gen
volgorde
Dat
is
deel
van
de
volgorde
gegevens
gegenereerd
door
de
Internationale
Menselijk
genoom
Projectie.
EEN
schermafbeelding
van
dit
GenBank
dossier
is
getoond
Aan
de
De volgende
bladzijde.


ONS.
afdeling
van
Energie
Kantoor
van
biologisch
en
Milieu
Onderzoek


De
Gen
poort
Werkboek


5. Controleer
uit
sommige
van
de
volgend op
Kenmerken
in
de
GenBank
dossier.
• • Bij
de
bovenkant
wij
zien
Dat
enkel en alleen
een
heel
klein
deel
van
chromosoom
6
(van
26.087.448ste
baseren
tot
26.097.059ste
baseren)
is
inbegrepen
in
dit
dossier.
De
eerst
Verwijzing
vermeld
voor
dit
dossier
identificeert
de
"Internationale
Menselijk
genoom
Volgorde aanbrengen in
Consortium"
als
de
bron
voor
dit
volgorde
informatie.
Dus
dit
volgorde
is
een
Product
van
de
Internationale
Menselijk
genoom
Projectie.


Ook al
na
een
genoom
volgorde
is
gepubliceerd
in
een
logboek
en
gemeld
als
"compleet,"
de
Onderzoek
gemeenschap
gaat verder
tot
analyseren
de
genoom
volgorde
gegevens
en
verbeteren
de
annotatie
Dat
beschrijft
verschillend
Kenmerken
gecodeerd
binnenin
de
genoom
volgorde.
Opmerking
Dat
dit
dossier
was
laatste
gewijzigd
oktober
25,
2010.

6. Scrollen
omlaag
tot
de
KENMERKEN
sectie
van
dit
GenBank
dossier
(zien
schermafbeelding
Aan
De volgende
bladzijde).

• • De
HFE
gen
is
9,612
baseren
paren
(bp)
lang.
De
informatie
in
dit
GenBank
dossier
voor
de
HFE
gen
was
"Afgeleid van
door
geautomatiseerd
computationeel
analyse
gebruik makend van
gen
voorspelling
methode"
als
een
deel
van
de
Menselijk
genoom
Projectie.

Van
de
meerdere
inzendingen
voor
"mRNA"
vermeld
in
dit
dossier,
wij
zien
Dat
meer
dan
een
mRNA
vertaling
kan
zijn
gegenereerd
van
de
HFE
gen.
Voor
voorbeeld,
een
exon
inbegrepen
in
een
mRNA
vertaling
macht
zijn
links
uit
in
een ander
vertaling.
Elk
van
deze
verschillend
mRNA
transcripties
van
de
dezelfde
gen
is
bekend
als
een
"variant."


ONS.
afdeling
van
Energie
Kantoor
van
biologisch
en
Milieu
Onderzoek


De
Gen
poort
Werkboek



7. Gebruik
jouw
browser's
"rug"
knop
tot
opbrengst
tot
de
Entrez
Gen
bladzijde
voor
de
menselijk
HFE
gen.

8. Laten we
toegang
een ander
GenBank
dossier
voor
de
HFE
gen
volgorde
tot
zien
hoe
informatie
kan
variëren
in
records
Dat
komen
van
verschillend
bronnen.
Als
getoond
in
de
schermafbeelding
Aan
de
De volgende
bladzijde,
selecteer
de
Verwant
sequenties
koppeling
in
de
Tafel
van
inhoud
doos
Aan
de
Rechtsaf
kant
van
de
scherm.





ONS.
afdeling
van
Energie
Kantoor
van
biologisch
en
Milieu
Onderzoek


De
Gen
poort
Werkboek


9. In
de
Verwant
Sequenties
voor
de
HFE
gen
(zien
schermafbeelding
Aan
de
De volgende
bladzijde),
selecteer
de
genomisch
volgorde
dossier
Z92910.1.

Hoe
deed
jij
weten
die
genomisch
volgorde
tot
selecteren?

De
probleem
met
archief
volgorde
databases
Leuk vinden
NCBI's
GenBank
is
Dat
zij
gebruikelijk
hebben
meerdere
volgorde
records
voor
de
dezelfde
gen.
Jij
kunnen
nodig hebben
tot
open
elk
dossier
individueel
en
bladeren
door
definitie,
volgorde
annotatie,
en
opmerkingen
tot
bepalen
hoe
veel
van
de
genen
nucleotide
volgorde
is
bevatte
binnenin
elk
dossier.

Voor
voorbeeld,
de
U91328.1
dossier
bevat
de
volgorde
van
een
genomisch
segment
Dat
niet
enkel en alleen
omvat
de
HFE
gen
volgorde
maar
ook
sequenties
voor
ander
genen.
Y09801.1
bevat
enkel en alleen
volgorde
informatie
voor
de
HFE
promotor
en
de
HFE
genen
eerst
exon.
Van
de
genomisch
records
vermeld,
Z92910.1
heeft
de
meest
compleet
volgorde
informatie
voor
de
HFE
gen.

In
volgorde
databases
zo een
als
GenBank,
"genomisch"
DNA
volgorde
records
voor
eukaryoot
organismen
bevatten
beide
exonen
en
intronen,
terwijl
"mRNA"
sequenties
zijn
intron-‐vrij
DNA
sequenties.
Alle
sequenties
in
GenBank
en
vergelijkbaar
repositories
gebruik maken van
de
enkele letter
afkortingen
voor
de
DNA
basissen
adenine
(EEN),
cytosine
(C),
guanine
(G),
en
thymine
(T)
tot
staan ​​voor
elk
nucleotide.
Ook al
"mRNA"
volgorde
records
gebruik maken van
EEN,
C,
G,
en
t
waar
t
is
gebruikt
tot
vervangen
elk
uracil
(U)
in
de
mRNA
volgorde.


ONS.
afdeling
van
Energie
Kantoor
van
biologisch
en
Milieu
Onderzoek


De
Gen
poort
Werkboek


Verwant
Sequenties
voor
de
HFE
Gen
in
Entrez
Gen


10 A
schermafbeelding
van
de
GenBank
dossier
Z92910.1
voor
de
HFE
gen
is
getoond
Aan
de
De volgende
bladzijde.
• De
DNA
volgorde
inbegrepen
in
dit
dossier
is
12,146
baseren
paren
(bp)
lang.
In
toevoeging
tot
bevattende
de
genomisch
volgorde
van
de
HFE
gen,
dit
dossier
ook
bevat
meerdere
honderd
aanvullend
baseren
paren
van
volgorde
stroomopwaarts
en
stroomafwaarts
van
de
gen.
Dit
dossier
was
oorspronkelijk
ingediend
door
een
onderzoeker
tot
GenBank
in
1997,
dus
de
volgorde
van
de
HFE
gen
was
bekend
meerdere
jaar
voordat
de
Menselijk
genoom
Project
was
compleet.
Rol
omlaag
tot
de
KENMERKEN
sectie
van
dit
dossier
en
gebruik maken van
dit
informatie
tot
antwoord geven
Vragen
2–4
voor
Werkzaamheid
3
Aan
bladzijde
52.
Opmerking
Dat
klikken
Aan
de
gen
koppeling
in
de
KENMERKEN
sectie
shows
Dat
de
lengte
van
de
HFE
gen
is
verschillend
van
wat
wij
opgemerkt
in
de
GenBank
dossier
onderzocht
in
stap
5
van
dit
werkzaamheid.

ONS.
afdeling
van
Energie
Kantoor
van
biologisch
en
Milieu
Onderzoek


De
Gen
poort
Werkboek


GenBank
Dossier
Z92910.1
voor
Menselijk
HFE
Gen


11. Sommige
Kenmerken
van
de
volgorde
in
GenBank
dossier
Z92910.1
erbij betrekken

bron:
Verplicht
voor
elk
GenBank
dossier,
de
bron
voorziet in
de
geheel
volgorde
lengte
en
de
wetenschappelijk
naam
van
de
bron
organisme.
Ander
types
van
bron
informatie
kunnen
erbij betrekken
chromosoom
nummer,
kaart
plaats,
en
kloon
of
deformatie
identificatie.
gen:

Dit
functie
voorziet in
nucleotide
nummers
wijzend op
waar
de
gen
stopt
en
begint.
Dit
koppeling
opent
een
nieuwe
volgorde
dossier
Dat
shows
enkel en alleen
de
gen
volgorde.

exon:
Dit
functie
voorziet in
nucleotide
nummers
wijzend op
waar
elk
exon
begint
en
loopt af.
Jij
zullen
zien
meerdere
van
deze
inzendingen
als
jij
rol
omlaag.
Elk
exon
is
een
volgorde
segment
Dat
codes
voor
een
deel
van
verwerkt
(intron-‐vrij)
mRNA.
De
naam
van
de
gen

ONS.
afdeling
van
Energie
Kantoor
van
biologisch
en
Milieu
Onderzoek


De
Gen
poort
Werkboek


tot
die
de
exon
behoort tot
en
de
exon
nummer
zijn
mits.
Een
"exon"
koppeling
opent
een
nieuwe
volgorde
dossier
Dat
shows
enkel en alleen
de
exon
volgorde.
• CDS:
De
codering
volgorde
(CDS)
bestaat uit
van
nucleotiden
Dat
eigenlijk
code
voor
amino
zuren
van
de
eiwit
Product.
Dit
functie
omvat
de
codering
sequenties
amino
zuur
vertaling
en
kunnen
ook
bevatten
gen
naam,
gen
Product
functie,
een
koppeling
tot
eiwit
volgorde
dossier,
en
kruisverwijzingen
tot
ander
database
inzendingen.
EEN
"CDS"
koppeling
opent
een
nieuwe
volgorde
dossier
Dat
shows
enkel en alleen
de
codering
volgorde.
intron:
Dit
functie
voorziet in
de
nucleotide
nummers
wijzend op
waar
elk
intron
begint
en
loopt af.
Een
intron
is
een
segment
van
niet-coderen
volgorde
Dat
is
getranscribeerd
maar
VERWIJDERD
van
de
vertaling
door
splitsen
samen
de
exonen
Aan
of
kant
van
het.
Een
"intron"
koppeling
opent
een
nieuwe
volgorde
dossier
Dat
shows
enkel en alleen
de
intron
volgorde.
Wat is?
de
verschil
tussen
exonen
en
codering
volgorde?

Exons
vaak
zijn
beschreven
als
kort
segmenten
van
eiwit
codering
volgorde.
Dit
is
een
beetje
van
een
oversimplificatie.
Exons
zijn
segmenten
van
volgorde
gesplitst
samen
na
intronen
hebben
geweest
VERWIJDERD
van
pre-‐mRNA.
Exons
dragen
de
codering
volgorde
van
een
gen,
maar
sommige
exonen
kunnen
bevatten
Nee
codering
volgorde.
Porties
van
exonen
of
ook al
geheel
exonen
kunnen
bevatten
volgorde
Dat
is
niet
vertaald
naar binnen
amino
zuren.
Deze
zijn
de
onvertaald
Regio's
(UTR)
van
mRNA.
UTR's
zijn
gevonden
stroomopwaarts
en
stroomafwaarts
van
de
eiwit-‐ codering
volgorde.
Zien
diagram
Aan
Rechtsaf.


12. Volgorde
informatie
in
een
GenBank
dossier
kan
ook
zijn
weergegeven
gebruik makend van
afbeeldingen
in
de
NCBI
Volgorde
kijker.
Tot
toegang
Volgorde
kijker
van
een
GenBank
dossier,
Klik
Aan
de
Grafische afbeeldingen
koppeling
in
de
bovenste
links
hoek
(als
getoond
onderstaand).


ONS.
afdeling
van
Energie
Kantoor
van
biologisch
en
Milieu
Onderzoek


De
Gen
poort
Werkboek


13. De
Volgorde
kijker
optie
voor
GenBank
dossier
Z92910.1
is
getoond
in
de
schermafbeelding
onderstaand.
• De
bovenkant
paneel
toont
de
geheel
volgorde
inbegrepen
in
de
GenBank
dossier,
de
groente
bar
vertegenwoordigt
de
HFE
gen
volgorde,
en
de
blauw
schetsen
van
een
doos
met
pijlen
geeft aan
die
deel
van
de
volgorde
is
getoond
in
de
paneel
onderstaand.
Klik
en
sleuren
de
pijlen
Aan
de
blauwe doos
schetsen
tot
verandering
hoe
veel
van
de
volgorde
is
weergegeven
in
de
lager
paneel.
Jij
kan
ook
gebruik maken van
de
pijlen
Aan
de
links
kant
van
de
lager
paneel
tot
Actie
langs
de
volgorde
en
zien
waar
exonen
en
ander
gen
Kenmerken
beginnen
en
einde.
De
schuifregelaar
onderstaand
de
pijlen
kan
zijn
gebruikt
tot
zoom
in
en
uit
Aan
de
volgorde.

ONS.
afdeling
van
Energie
Kantoor
van
biologisch
en
Milieu
Onderzoek


De
Gen
poort
Werkboek


Activiteit 4
Online bronnen: UniProt Protein Knowledgebase en BLAST Zoeken • Toegang tot de aminozuursequentie van het eiwitproduct van een gen. • Vergelijk de HFE-eiwitsequentie met eiwitsequenties van andere organismen.

UniProt Protein Knowledgebase en BLAST zoeken
De
Eiwit
Kennis basis,
die
is
deel
van
de
Universeel
Eiwit
Bron
(UniProt),
is
een
uitgebreide,
vrij
toegankelijk
database
Dat
de
wetenschappelijk
gemeenschap
toepassingen
tot
toegang
hoge kwaliteit
eiwit
volgorde
en
functioneel
informatie.
Dit
werkzaamheid
covers
hoe
tot
gebruik maken van
UniProt
tot
leren
wat betreft
de
amino
zuur
volgorde
en
ander
Kenmerken
van
de
erfgenaam
hemochromatose
eiwit.

1. Ga
tot
de
UniProt
huis
bladzijde
(www.uniprot.org),
binnenkomen
HFE
naar binnen
de
vraag
doos
als
getoond
in
de
schermafbeelding
onderstaand,
en
dan
indienen
jouw
zoeken.


2. Van
de
lijst
van
resultaten
(weergegeven)
in
de
schermafbeelding
Aan
de
De volgende
bladzijde),
kennisgeving
Dat
sommige
inzendingen
hebben
goud
sterren
en
anderen
hebben
grijs
sterren.
Die
met
goud
sterren
hebben
beschrijvingen
van
eiwit
functies
en
kenmerken
Dat
hebben
geweest
handmatig
beoordeeld
door
experts.
Inzendingen
met
grijs
sterren
hebben
beschrijvingen
Dat
waren
automatisch
gegenereerd,
en
experts
hebben
niet
nog
beoordeeld

ONS.
afdeling
van
Energie
Kantoor
van
biologisch
en
Milieu
Onderzoek


De
Gen
poort
Werkboek


deze
verslagen.
Dus
selecteren
een
zoeken
resultaat
met
een
goud
ster
zullen
voorzien in
jij
met
rijker,
hoger
kwaliteit
informatie
wat betreft
een
eiwit.
• Selecteer
toetreding
nummer
Q30201
voor
de
HFE_HUMAN
binnenkomst
voor
de
erfgenaam
hemochromatose
eiwit.


3. De
UniProt
binnenkomst
voor
de
HFE
eiwit
is
getoond
Aan
de
De volgende
bladzijde.
De
blauw
navigatie
bar
Bij
de
bovenkant
van
de
scherm
bevat
links
tot
verschillend
onderdelen
van
de
UniProt
dossier
voor
dit
eiwit.
• • Maken
een
Opmerking
van
de
toetreding
nummer
(Q30201)
voor
dit
eiwit.
We
zullen
gebruik maken van
de
toetreding
nummer
tot
zoeken
voor
eiwit
structureel
informatie
in
Werkzaamheid
5.

Rol
omlaag
door
de
dossier
en
beoordeling
de
Eiwit
attributen
en
de
Algemeen
annotatie
secties
tot
antwoord geven
Vragen
1–3
voor
Werkzaamheid
4
in
de
werkblad
Aan
bladzijde
52.


4. In
de
Eiwit
attributen
sectie,
voor
"Volgorde
verwerken,"
Opmerking
"De
weergegeven
volgorde
is
verder
verwerkt
naar binnen
een
volwassen
formulier."
Dit
middelen
Dat
deel
van
de
HFE
eiwit
ketting
behoeften
tot
zijn
snee
uit
door
een
proteolytisch
enzym
tot
formulier
de
"volwassen"
functioneel
eiwit.


ONS.
afdeling
van
Energie
Kantoor
van
biologisch
en
Milieu
Onderzoek


De
Gen
poort
Werkboek


5. Klik op
Aan
Volgorde
annotatie
in
de
blauw
navigatie
bar
in de buurt
de
bovenkant
van
de
dossier
(gemarkeerd
in
de
schermafbeelding
bovenstaand).

6. De
Volgorde
annotatie
sectie
van
de
HFE
eiwit
dossier
is
getoond
in
de
schermafbeelding
Aan
de
De volgende
bladzijde.

• Onder
"Molecuul
verwerken"
in
de
Volgorde
annotatie
sectie,
kennisgeving
Dat
de
signaal
peptide
omvat
amino
zuren
1–22.
De
eerst
22
amino
zuren
zijn
niet
geassocieerd
met
ieder
domeinen
(functioneel)
eenheden
binnenin
een
eiwit).
Dit
deel
is
gespleten
van
de
compleet
eiwit
volgorde
tot
maken
de
volwassen,
functioneel
HFE
eiwit,
die
bestaat uit
van
amino
zuren
23–348.
Klikken op
Aan
de
blauw
“Positie(s)”
nummers
in
de
volgorde
annotatie
zullen
open
een
raam
laten zien
de
geselecteerd
volgorde
gemarkeerd
binnenin
de
context
van
de
geheel
eiwit
volgorde.
In
Werkzaamheid
1
wij
geleerd
Dat
de
cysteïne
Bij
amino
zuur
positie
282
is
veranderd
tot
een
tyrosine
in
een
gemeenschappelijk
mutatie
Dat
oorzaken
hemochromatose.
Beoordeling
de
"Regio's"
en
“Amino
zuur
wijzigingen”
onderdelen
van
de
Volgorde
annotatie
sectie
tot
antwoord geven
Vragen
4–5
voor
Werkzaamheid
4
Aan
bladzijde
52.

ONS.
afdeling
van
Energie
Kantoor
van
biologisch
en
Milieu
Onderzoek


De
Gen
poort
Werkboek


7. Scrollen
omlaag
tot
de
"Ondergeschikt
structuur"
deel
van
de
Volgorde
annotatie
sectie
(weergegeven)
in
afbeelding
onderstaand)
en
Klik
Aan
Details
onderstaand
de
gekleurd
bar.


8. De
ondergeschikt
structuur
details
laten zien
die
segmenten
van
eiwit
volgorde
maken
omhoog
bèta
strengen,
alfa
helices,
of
de
draait
Dat
formulier
tussen
bèta
strengen
en
alfa
helices.
Deze
ondergeschikt
elementen
zijn
belangrijk
in
het bepalen van
de
driedimensionaal
eiwit
structuur.
Gebruik maken van
dit
ondergeschikt
structureel
informatie
tot
antwoord geven
Vraag
6
voor
Werkzaamheid
4
Aan
bladzijde
52.
9. Keer terug
tot
de
bovenkant
van
de
HFE
eiwit
dossier
door
scrollen
of
door
klikken
Namen
in
de
blauw
navigatie
bar.
Klik
Aan
de
Ontploffing
tabblad
Bij
de
bovenkant
van
de
bladzijde.

ONS.
afdeling
van
Energie
Kantoor
van
biologisch
en
Milieu
Onderzoek


De
Gen
poort
Werkboek


OPMERKING:
ONTPLOFFING
(basis)
lokaal
Uitlijning
Zoeken
Hulpmiddel)
is
een
hulpmiddel
gebruikt
tot
berekenen
hoe
vergelijkbaar
nucleotide
of
eiwit
sequenties
zijn
tussen
de
dezelfde
of
verschillend
soorten
van
organismen.
Veel
bronnen
Dat
behouden
biologisch
volgorde
informatie
vaak
steun
hun
eigen
ONTPLOFFING
zoeken
mogelijkheden
tot
uittreden
en
vergelijken
volgorde
gegevens.
Voor
meer
informatie
wat betreft
ONTPLOFFING,
zien
De
NCBI
Handboek
(www.ncbi.nlm.nih.gov/books/NBK21097/).
Eiwit
sequenties
zijn
vaak
voorkeur
over
nucleotide
sequenties
voor
ONTPLOFFING
zoeken
omdat
van
de
groter
variabiliteit
in
nucleotide
sequenties.
Onthouden
met
de
genetisch
code,
verschillend
codons
van
nucleotiden
kan
specificeren
de
dezelfde
amino
zuur.
Dus
eiwitten
Dat
hebben
vergelijkbaar
amino
zuur
sequenties
kunnen
hebben
aanzienlijk
verschillend
nucleotide
sequenties
codering
die
eiwitten.


10 A
schermafbeelding
van
de
ONTPLOFFING
zoeken
functie
voor
de
HFE
eiwit
is
getoond
onderstaand.

• De
amino
zuur
volgorde
van
de
compleet
HFE
eiwit
is
automatisch
ingevoerde
naar binnen
de
tekst
doos
Aan
de
links.
De
enkele letter
afkortingen
gebruikt
tot
staan ​​voor
elk
amino
zuur
zijn
uitgelegd
in
de
Tafel
van
Standaard
genetisch
Code
Aan
bladzijde
50.

Klik
Aan
de
Ontploffing
knop
tot
vergelijken
de
amino
zuur
volgorde
van
de
HFE
eiwit
met
alle
de
sequenties
beschikbaar
van
de
UniProt
Kennis basis.
Zijn
geduldig.
EEN
ONTPLOFFING
zoeken
kunnen
nemen
meerdere
minuten
afhankelijk
Aan
hoe
druk bezig
de
server
is.

11. Eenmaal
de
resultaten
zijn
opgehaald,
rol
omlaag
tot
de
Gedetailleerd
ONTPLOFFING
resultaten
(zien
schermafbeelding
Aan
De volgende
bladzijde).

• De
Identiteit
kolom
Aan
de
Rechtsaf
voorziet in
de
procent
van
elk
inzendingen
amino
zuur
volgorde
Dat
is
identiek
tot
de
volgorde
ingediend.
Tot
soort
alle
van
jouw
resultaten
van
hoogste
tot
laagste
Identiteit
waarden,
Klik
Aan
de
pijlen
Bij
de
bovenkant
van
de
Identiteit
kolom.
Tot
zien
meer
resultaten,
Klik
Volgende
in
de
bovenste
Rechtsaf
hoek.

Gebruik maken van
de
Gedetailleerd
ONTPLOFFING
resultaten
tot
antwoord geven
Vraag
7
voor
Werkzaamheid
4
Aan
bladzijde
53.



ONS.
afdeling
van
Energie
Kantoor
van
biologisch
en
Milieu
Onderzoek


De
Gen
poort
Werkboek


Gedetailleerd
ONTPLOFFING
Resultaten
voor
de
HFE
Eiwit
in
UniPROt


ONS.
afdeling
van
Energie
Kantoor
van
biologisch
en
Milieu
Onderzoek


De
Gen
poort
Werkboek


Activiteit 5
Online bronnen: Protein Data Bank • Onderzoek de sequentie en structuur van het eiwitproduct van het gen.

Eiwitdatabank
Dit
werkzaamheid
demonstreert
hoe
tot
vind
en
weergave
een
eiwit
structuur
gebruik makend van
gereedschap
en
bronnen
beschikbaar
van
de
Eiwit
Gegevens
bank
(VOB).
VOB
is
een
Internationale
archief
van
3-‐D
structureel
informatie
voor
biologisch
macromoleculen.
VOB
records
voorzien in
toegang
tot
meerdere
interactief
moleculair
afbeeldingen
programma's.
Dit
werkzaamheid
ook
toepassingen
Eerste gezicht
in
Jmol,
een
hulpbron
Dat
werken
in
meest
browsers
voor
bekijken
de
belangrijk
moleculair
Kenmerken
van
een
structuur
met
alleen maar
een
Enkele
muis-‐ klikken.




Voordat je begint
Veel
Kenmerken
van
de
VOB
website
vereisen
nieuwer
Web
browsers
met
JavaScript
en
koekjes
ingeschakeld,
en
pop-ups
zou moeten
niet
zijn
geblokkeerd.
Voor
meer
informatie
Aan
systeem
vereisten
zien
VOB
Vaak
Gevraagd
Vragen
(www.rcsb.org/pdb/static.do?p=home/faq.html).


Enkele basisprincipes van de eiwitstructuur
• Eiwitten
zijn
gemaakt
door
linken
amino
zuren
in
een
lineair
mode
tot
formulier
polypeptide
kettingen.
De
amino
zuur
volgorde
van
een
polypeptide
ketting
is
de
primair
structuur
van
een
eiwit.
Zien
de
Tafel
van
Standaard
genetisch
Code
Aan
bladzijde
50
voor
enkele letter
en
drieletterig
afkortingen
voor
de
20
verschillend
amino
zuren.
Amino
zuren
hebben
verschillend
chemisch
eigendommen.
Voor
voorbeeld,
sommige
amino
zuur
residuen
zijn
strikt
hydrofoob
("water
bang")
en
moeten
zijn
beschermd
van
waterig
omgevingen,
terwijl
ander
amino
zuren
zijn
hydrofiel
("water
liefdevol").
De
vervanging
van
alleen maar
een
amino
zuur
voor
een ander
met
heel
verschillend
chemisch
eigendommen
kan
hebben
echt
gevolgen
voor
een
eiwitten
structuur
en
functie.
De
vouwen
van
Regio's
binnenin
de
polypeptide
ketting
naar binnen
alfa
helices
en
bèta
lakens
is
een
eiwitten
ondergeschikt
structuur.
De
inpakken
van
de
geheel
polypeptide
ketting
naar binnen
een
driedimensionaal
bolvormig
eenheid
is
een
eiwitten
tertiair
structuur.
Indien
een
eiwit
molecuul
is
een
complex
van
meer
dan
een
polypeptide
ketting,
dan
de
compleet
structuur
van
dit
moleculair
complex
is
genaamd
een
eiwitten
quaternair
structuur.
EEN
domein
is
een
discreet
deel
van
een
eiwit
met
zijn
eigen
functie
en
specifiek
driedimensionaal
structuur.
De
combinatie
van
domeinen
in
een
enkel
eiwit
bepaalt
zijn
algemeen
functie.
Verschillend
onderdelen
van
een
polypeptide
ketting
kan
zijn
gekoppeld
door
disulfide
bruggen
Dat
formulier
tussen
twee
cysteïne
residuen.
disulfide
bruggen
(of
disulfide
obligaties)
stabiliseren
een
eiwitten
driedimensionaal
structuur.
De
verlies
van
een
disulfide
brug
zou
zijn
nadelig
tot
een
eiwitten
algemeen
structuur.

ONS.
afdeling
van
Energie
Kantoor
van
biologisch
en
Milieu
Onderzoek


De
Gen
poort
Werkboek


Een structuurrecord zoeken in PDB
1. Om
beginnen,
laten we
Gaan
tot
de
Eiwit
Gegevens
bank
(www.rcsb.org/pdb/).

OPMERKING:
Indien
jij
zijn
nieuwe
tot
VOB,
zijn
zeker
tot
rekening
uit
de
Opleiding
links
in
de
licht


blauw
kolom
Aan
de
links
van
de
scherm.
Onder
Leerzaam
Bronnen
jij
kan
vind
affiches,
bijlessen,
activiteiten,
en
lessen.
Molecuul
van
de
Maand
is
een
verzameling
van
vignetten,
elk
met
een
verschillend
moleculair
structuur
en
zijn
belang
tot
menselijk
welzijn.

2. Naast
de
zoeken
doos
Bij
de
bovenkant
van
de
VOB
huis
bladzijde,
selecteer
Geavanceerd
Zoeken.


ONS.
afdeling
van
Energie
Kantoor
van
biologisch
en
Milieu
Onderzoek


De
Gen
poort
Werkboek


3. Aan
de
Geavanceerd
Zoeken
bladzijde,
van
de
Kiezen
een
Vraag
Type
laten vallen
doos
selecteer
UniProtKB
Toetreding
Nummer(s).
In
Werkzaamheid
4
wij
benaderd
de
menselijk
hemochromatose
eiwit
dossier
Q30201
in
de
UniProt
Eiwit
Kennis basis.
Binnenkomen
Q30201
in
de
zoeken
doos.
De
Geavanceerd
zoeken
bladzijde
zou moeten
kijk
Leuk vinden
de
schermafbeelding
onderstaand.
Selecteer
de
Indienen
Vraag
knop
tot
indienen
jouw
zoeken.


4. De
zoeken
zou moeten
opbrengst
twee
treffers.
Rol
omlaag
de
bladzijde
tot
zien
een
kort
samenvatting
van
elk
zoeken
resultaat.
Een
dossier
(1DE4)
voorziet in
structureel
informatie
Aan
de
hemochromatose
eiwit
HFE
gecomplexeerd
met
een
receptor,
en
de
ander
dossier
(1A6Z)
alleen maar
voorziet in
structureel
informatie
voor
de
HFE
eiwit.
Klik
Aan
1A6Z
HFE
(MENSELIJK)
HEMOCHROMATOSE
EIWIT
tot
open
dit
VOB
dossier.

ONS.
afdeling
van
Energie
Kantoor
van
biologisch
en
Milieu
Onderzoek


De
Gen
poort
Werkboek

Opmerking
de
moleculair
Beschrijving
doos
in
de
centrum
van
de
schermafbeelding.
Dit
structuur
is
een
complex
van
vier
polymeer
kettingen:
EEN,
B,
C,
en
NS.
EEN
en
C
zijn
identiek
HFE
polypeptide
kettingen,
en
B
en
NS
zijn
identiek
kettingen
van
een ander
eiwit
genaamd
beta-‐2-‐microglobuline.

Opmerking
de
primair
Citaat
in
de
1A6Z
dossier.
De
het beste
manier
tot
leren
wat betreft
structuur
details
is
tot
toegang
de
artikel
vermeld
als
de
primair
citaat.
Hoewel
de
vol
tekst
voor
sommige
Lidwoord
kunnen
zijn
vrij
beschikbaar
online,
veel
Lidwoord
zijn
toegankelijk
enkel en alleen
door
abonnement.
Sommige
Universiteit
Onderzoek
bibliotheken
kunnen
voorzien in
openbaar
toegang
tot
hun
logboek
collecties.
De
artikel
voor
dit
structuur
heeft
geweest
benaderd
tot
onthullen
de
volgend op
details:
o Alleen
de
oplosbaar
deel
van
de
HFE
polypeptide
ketting
is
inbegrepen
in
de
1A6Z
structuur.
De
transmembraan
domein
is
missend,
dus
de
HFE
eiwit
in
dit
structuur
heeft
enkel en alleen
275
van
de
348
amino
zuren
in
de
compleet
HFE
eiwit
volgorde.

De
eerst
22
amino
zuren
van
de
HFE
polypeptide
volgorde
hebben
geweest
uitgesloten
omdat
zij
zijn
niet
deel
van
de
volwassen,
functioneel
eiwit.
Daarom,
de
eerst
amino
zuur
in
dit
structuur
is
Echt
de
23e,
en
cysteïne
260
is
de
cysteïne
residu
betrokken
in
de
CYS282TYR
mutatie
Dat
wij
geleerd
wat betreft
in
Activiteit 1.

ONS.
afdeling
van
Energie
Kantoor
van
biologisch
en
Milieu
Onderzoek


De
Gen
poort
Werkboek

Elk
HFE
polypeptide
ketting
is
gecomplexeerd
met
een ander
polypeptide
ketting
genaamd
beta-‐2-‐microglobuline.

De
1A6Z
structuur
bestaat uit
van
twee
HFE-bèta-‐2
microglobuline
complexen.


6. Selecteer
de
Volgorde
tabblad
tot
onderzoeken
de
volgorde
en
ondergeschikt
structuur
details
voor
dit
structuur.

7. De
Volgorde
en
Structuur
Details
voor
dossier
1A6Z
zijn
getoond
in
de
schermafbeelding
onderstaand.

• De
HFE
eiwit
volgorde
(polypeptide
ketting
EEN)
is
gepresenteerd
eerst.
Elk
brief
in
de
eiwit
volgorde
vertegenwoordigt
een
verschillend
amino
zuur.
C
staat
voor
cysteïne.
Zien
de
Tafel
van
Standaard
genetisch
Code
Aan
bladzijde
50
tot
bepalen
die
amino
zuur
is
vertegenwoordigd
door
elk
brief.

Ondergeschikt
structuur
details
zijn
in kaart gebracht
op
volgorde
details.
Verschillend
grafisch
symbolen
zijn
gebruikt
tot
staan ​​voor
verlengd
bèta
strengen,
alfa
helixen,
bochten,
en
draait.


ONS.
afdeling
van
Energie
Kantoor
van
biologisch
en
Milieu
Onderzoek


De
Gen
poort
Werkboek


8. Selecteer
de
Scherm
extern
(UniProtKB)
volgorde
koppeling
gemarkeerd
in
de
vorig
schermafbeelding.
9. De
volgorde
bladzijde
zullen
herladen
en
Scherm
de
amino
zuur
nummers
voor
de
UniProt
HFE
eiwit
volgorde
(Dat
wij
onderzocht
in
Werkzaamheid
4)
bovenstaand
de
lijn
van
enkele letter
amino
zuur
afkortingen
(zien
schermafbeelding
onderstaand).

• • Vind
cysteïne
282
in
de
UniProt
volgorde.
cysteïne
282
is
de
amino
zuur
Dat
is
vervangen
door
tyrosine
in
de
CYS282TYR
mutatie.

Jij
zullen
zien
Dat
cysteïne
282
in
de
UniProt
volgorde
is
Bij
positie
260
in
de
VOB
structuur
volgorde.
In
Werkzaamheid
4,
wij
geleerd
Dat
cysteïne
282
formulieren
een
disulfide
verbintenis
met
cysteïne
225
in
de
UniProt
HFE
eiwit
volgorde.
In
de
HFE
eiwit
volgorde
voor
VOB
structuur
1A6Z,
wij
zien
Dat
cysteïne
260
formulieren
een
disulfide
verbintenis
met
cysteïne
203
(die
komt overeen
tot
cysteïne
225
in
de
UniProt
volgorde).
disulfide
obligaties
zijn
kritisch
tot
vormen
de
juist
structureel
regeling
nodig zijn
tot
maken
een
functioneel
eiwit
daarom,
de
verlies
van
cysteïne
260
zou
zijn
nadelig
tot
eiwit
structuur.
Antwoord geven
de
eerst
twee
vragen
voor
Werkzaamheid
5
in
de
werkblad
Aan
bladzijde
54.


De structuur bekijken
10. Selecteer
de
Samenvatting
tabblad
in de buurt
de
bovenkant
van
de
bladzijde
tot
opbrengst
tot
de
1A6Z
dossier
samenvatting.
In
de
biologisch
samenkomst
1
doos
in
de
bovenste
Rechtsaf
hoek
van
de
bladzijde
daar
zijn
meerdere
opties
voor
bekijken
de
moleculair
structuur.
Klikken op
Aan
de
Meer
Afbeeldingen…
koppeling
zullen
open
een
bladzijde
met
opties
voor
downloaden
een
nog altijd
afbeelding
van
de
HFE
moleculair
complex
1A6Z.
Hoewel
VOB
voorziet in
toegang
tot
meerdere
verschillend
moleculair
kijkers
voor
onderzoeken
een
3-‐D
vertegenwoordiging
van
een
moleculair
complex,
veel
van
deze
opties
waren
ontworpen
voor
wetenschappers
WHO
specialiseren
in
aan het studeren
moleculair
structuren.
In
dit
werkzaamheid,
wij
zullen
gebruik maken van
een
moleculair
kijker
genaamd
Eerste gezicht
in
Jmol,
die
is
een
van
de
meer
gebruiksvriendelijk
opties
voor
weergeven van
de
belangrijk
structureel
Kenmerken
van
een
molecuul.
Eerste gezicht
in
Jmol
was
ontwikkelde
tot
werk
in
alle
populair
web
browsers
zonder
hebben
tot
downloaden
en
installeren
iets.

ONS.
afdeling
van
Energie
Kantoor
van
biologisch
en
Milieu
Onderzoek


De
Gen
poort
Werkboek


11. Om
toegang
Eerste gezicht,
eerst
Klik
Aan
de
links
pijl
De volgende
tot
de
biologisch
samenkomst
1
label
bovenstaand
de
moleculair
afbeelding.
Dit
zou moeten
verandering
de
doos
label
tot
Asymmetrisch
Eenheid.


12. Door
klikken
Aan
de
pijl
De volgende
tot
Ander
kijkers,
een
vervolgkeuzelijst
menu
zullen
verschijnen.
Selecteer
Eerste gezicht
van
de
vervolgkeuzelijst
menu
(zien
schermafbeelding
onderstaand).


ONS.
afdeling
van
Energie
Kantoor
van
biologisch
en
Milieu
Onderzoek


De
Gen
poort
Werkboek


13. A
nieuwe
bladzijde
zou moeten
open
weergeven van
structuur
1A6Z
gebruik makend van
Eerste gezicht
in
Jmol
(zien
schermafbeelding
onderstaand).

• • Tot
stop
de
draaien
van
de
molecuul,
Klik
de
Draaien
doos
in
de
bovenste
links.
Tot
verwijderen
de
S-‐
etiketten,
uitvinken
de
Laten zien
doos
naast
Etiketten
X,
S-‐,
?.


14. De
structuur
is
aanvankelijk
weergegeven
gebruik makend van
de
Tekenfilm
optie,
die
wijst toe
een
verschillend
kleur
tot
elk
moleculair
ketting
in
de
structuur.
Kettingen
EEN,
B,
C,
en
NS
zou moeten
zijn
weergegeven.
Eerder
in
de
werkzaamheid
wij
geleerd
Dat
kettingen
EEN
en
C
zijn
identiek
HFE
kettingen
en
kettingen
B
en
NS
zijn
identiek
beta-‐2-‐microglobuline
kettingen.

• • • • Klikken
overal
Aan
de
molecuul
zullen
genereren
een
label
in
de
lager
links
hoek
laten zien
de
amino
zuur
residu
en
de
eiwit
ketting
Dat
jij
hebben
geselecteerd.

Klik
Aan
elk
gekleurd
ketting
tot
vind
Ketting
EEN,
die
is
een
van
de
twee
HFE
eiwit
kettingen.
In
de
schermafbeelding
Aan
de
De volgende
bladzijde,
Ketting
EEN
is
de
blauw
ketting.
Indien
jij
nodig hebben
tot
draaien
de
structuur,
gewoon
Klik
Aan
de
structuur
en
sleuren
met
jouw
muis.

Tot
ongedaan maken
ieder
van
de
veranderingen
jij
hebben
gemaakt
en
resetten
de
structuur
tot
zijn
origineel
configuratie,
Klik
Resetten
in
de
bovenste
links
hoek.


ONS.
afdeling
van
Energie
Kantoor
van
biologisch
en
Milieu
Onderzoek


De
Gen
poort
Werkboek


Door
klikken
Aan
de
blauw
ketting,
de
label
in
de
lager
links
geeft aan
Dat
de
blauw
ketting
is
Ketting
A.


15. Laten we
verbergen
alle
de
kettingen
behalve
Ketting
A.
Klik
Aan
de
Verbergen..
koppeling
in
de
bovenste
links
hoek
en
dan
Klik
Aan
elk
ketting
behalve
Ketting
A.
Jouw
scherm
zou moeten
kijk
Leuk vinden
de
schermafbeelding
onderstaand.


16. Klik op
Aan
de
Centrum
Zichtbaar
Kettingen
koppeling
(gemarkeerd
in
schermafbeelding
bovenstaand)
tot
plaats
Ketting
EEN
in
de
centrum
van
de
Scherm
paneel.

ONS.
afdeling
van
Energie
Kantoor
van
biologisch
en
Milieu
Onderzoek


De
Gen
poort
Werkboek


17. Eenmaal
Ketting
EEN
is
gecentreerd,
gebruik maken van
de
Zoom
hulpmiddel
tot
vergroten
Ketting
A.
In
toevoeging
tot
gebruik makend van
de
Zoom
pijlen
in
de
bovenste
links
hoek,
jij
kan
zoom
in
en
uit
door
klikken
Aan
de
achtergrond
van
de
structuur
en
dan
gebruik makend van
de
Wiel
Aan
jouw
muis.
Alternatief,
jij
kan
ook
uitstel
omlaag
de
Verschuiving
toets
en
sleuren
de
muis
omhoog
en
omlaag
over
de
molecuul
tot
zoom
in
en
uit.
Jouw
scherm
zou moeten
iets
kijk
Leuk vinden
de
schermafbeelding
onderstaand.


18. Laten we
vind
cysteïne
260
en
cysteïne
203
(de
cysteïne
residuen
Dat
formulier
de
disulfide
verbintenis
betrokken
in
de
CYS282TYR
mutatie).
Klik
Aan
de
Vind..
koppeling
(gemarkeerd
in
schermafbeelding
bovenstaand).

19. De
Vind
optie
(weergegeven)
in
de
schermafbeelding
Aan
de
De volgende
bladzijde)
staat toe
jij
tot
zoeken
voor
bijzonder
residuen
binnenin
een
molecuul.
De
locaties
van
de
residuen
zijn
aangegeven
gebruik makend van
geel
stippen.
De
achtergrond
kleur
automatisch
veranderingen
tot
zwart
wanneer
jij
selecteer
Vind.
EEN
zwart
achtergrond
maakt
de
geel
stippen
makkelijker
tot
zien.
Jij
kan
schakelaar
tussen
zwart
en
wit
achtergrond
kleuren
door
klikken
Aan
de
Achtergrond
doos
in
de
bovenste
links
hoek.
• • • Type
CYS260,
CYS203
naar binnen
de
tekst
doos.
druk op
de
Binnenkomen
toets
Aan
jouw
toetsenbord
tot
indienen
jouw
zoeken.
Geel
stippen
zou moeten
wijzen op
waar
deze
twee
residuen
zijn
in
de
eiwit
ketting.
Jij
kunnen
nodig hebben
tot
draaien
de
structuur
door
klikken
en
slepen
jouw
muis
over
de
molecuul
dus
Dat
jij
kan
verwerven
een
Goed
weergave
van
de
geel
stippen.
Opmerking
Dat
de
geel
stippen
omringen
een
dun
goud
bar.
Dit
dun
goud
bar
vertegenwoordigt
een
disulfide
band.
Jij
kan
zien
Dat
een
verbintenis
tussen
cysteïnes
203
en
260
zou
creëren
een
sterk
verbinding
tussen
twee
verschillend
strengen
binnenin
de
eiwit.


ONS.
afdeling
van
Energie
Kantoor
van
biologisch
en
Milieu
Onderzoek


De
Gen
poort
Werkboek


vinden
cysteïne
residu's
in
de
HFE
Eiwit



20. Naar
verwerven
een
beter
weergave
van
de
disulfide
obligaties
in
de
HFE
eiwit,
Klik
Aan
de
Meer
Keer bekeken..
koppeling
in
de
bovenste
links
hoek,
en
dan
Klik
Aan
de
disulfide
Obligaties:
Laten zien
Alle
koppeling.
De
bladzijde
zou moeten
verandering
dus
Dat
het
ziet er uit
Leuk vinden
de
schermafbeelding
onderstaand.
De
ruggengraat
van
de
eiwit
ketting
is
gewijzigd
tot
een
dun
lijn
(die
is
moeilijk
tot
zien
in
de
schermafbeelding),
en
de
disulfide
obligaties
worden
dikker
en
makkelijker
tot
zien.
De
cysteïne
residuen
zijn
ook
gelabeld.
Antwoord geven
Vragen
3–4
voor
Werkzaamheid
5
in
de
werkblad
Aan
bladzijde
54.

ONS.
afdeling
van
Energie
Kantoor
van
biologisch
en
Milieu
Onderzoek


De
Gen
poort
Werkboek


21. Nu
Dat
jij
zijn
bekend
met
een
Enkele
opties
voor
wijzigen
een
moleculair
structuur
gebruik makend van
Eerste gezicht,
jij
kunnen
wil
tot
Resetten
de
structuur
en
oefening
wat
jij
hebben
geleerd.
In
toevoeging
tot
de
Scherm
opties
in
de
bovenste
links
hoek
van
de
scherm,
jij
kan
ook
gebruik maken van
pop-up
menu's
tot
aanpassen
de
structuur
door
klikken
Aan
Jmol
in
de
lager
Rechtsaf
hoek
van
de
Scherm
paneel
(gemarkeerd
in
de
vorig
schermafbeelding).
22. Als
jij
zijn
geïnteresseerd
in
kopiëren
of
besparing
een
bijzonder
weergave
van
een
structuur
Dat
jij
hebben
gemaakt,
rekening
uit
de
Presenteren
moleculair
Keer bekeken
van
Eerste gezicht
in
Jmol
bladzijde
(molvis.sdsc.edu/fgij/slides.htm).



Eiwitstructuur en erfelijke hemochromatose-ontwikkeling door
onderzoeken
de
HFE
eiwitten
volgorde
en
structuur,
wij
Ontdek
Dat
de
cysteïne
verloren
in
de
CYS282TYR
mutatie
heeft
een
belangrijk
rol
in
vestiging
de
juist
driedimensionaal
HFE
structuur.
In
dit
mutatie,
een
cysteïne
residu
is
vervangen
door
een ander
amino
zuur,
tyrosine,
en
de
disulfide
verbintenis
tussen
twee
cysteïnes
in
de
polypeptide
ketting
is
verloren.
Dit
is
nadelig
tot
de
eiwitten
structuur.
Als
een
resultaat,
de
HFE
eiwit
kan
Nee
langer
presteren
zijn
normaal
functie
van
regulerend
ijzer
opname,
en
cellen
worden
overbelast
met
ijzer.
Dit
opbouwen
van
ijzer
in
cellen,
indien
onbehandeld,
kan
leiding
tot
orgaan
schade
en
ander
complicaties.



ONS.
afdeling
van
Energie
Kantoor
van
biologisch
en
Milieu
Onderzoek


De
Gen
poort
Werkboek


Tabel met standaard genetische code voor het vertalen van DNA-sequentierecords T T
TTT Phe (F) TTC Phe (F) TTA Leu (L) TTG Leu (L) CTT Leu (L) CTC Leu (L) CTA Leu (L) CTG Leu (L) ATT Ile (I) ATC Ile (I) ATA Ile (I) ATG Met (M) START GTT Val (V) GTC Val (V) GTA Val (V) GTG Val (V)

C
TCT Ser (S) TCC Ser (S) TCA Ser (S) TCG Ser (S) CCT Pro (P) CCC Pro (P) CCA Pro (P) CCG Pro (P) ACT Thr (T) ACC Thr (T) ACA Thr (T) ACG Thr (T) GCT Ala (A) GCC Ala (A) GCA Ala (A) GCG Ala (A)

EEN
TAT Tyr (Y) TAC TAA STOP TAG STOP CAT His (H) CAC His (H) CAA Gln (Q) CAG Gln (Q) AAT Asn (N) AAC Asn (N) AAA Lys (K) AAG Lys (K) GAT Asp (D) GAC Asp (D) GAA Glu (E) GAG Glu (E)

G
TGT Cys (C) TGC TGA STOP TGG Trp (W) CGT Arg (R) CGC Arg (R) CGA Arg (R) CGG Arg (R) AGT Ser (S) AGC Ser (S) AGA Arg (R) AGG Arg (R) GGT Gly (G) GGC Gly (G) GGA Gly (G) GGG Gly (G)

Sleutel tot de tabel met standaard genetische code
Alanine Asparagine Cysteïne Glutamine Histidine Leucine Methionine Proline Threonine Tyrosine ALA ASN CYS GLN HIS LEU MET PRO THR TYR A N C Q H L M P T Y Arginine Asparaginezuur Glutaminezuur Glycine Isoleucine Lysine Fenylalanine Fenylalanine Serine Tryptofaan GLUINE ARG ARG A

START = Initiatiesignaal (betekent het begin van een polypeptideketen) STOP = Beëindigingssignaal (betekent het einde van een polypeptideketen)

ONS.
afdeling
van
Energie
Kantoor
van
biologisch
en
Milieu
Onderzoek


De
Gen
poort
Werkboek


Erfelijke hemochromatose werkblad
Dit
werkblad
voorziet in
vragen
tot
zijn
beantwoord
als
jij
compleet
de
activiteiten
in
de
Gen
poort
Werkboek.

1) Wat?
is
de
officieel
gen
symbool
van
de
erfgenaam
hemochromatose
gen?



2) Welke?
allelisch
variant
(genetisch)
mutatie)
meest
algemeen
oorzaken
erfgenaam
hemochromatose?



3) Wat?
zijn
sommige
kenmerken
van
erfgenaam
hemochromatose?
Hoe
is
het
behandeld?









Vragen voor Activiteit 2
1) Aan
de
diagram
tot
de
Rechtsaf,
markering
de
algemeen
regio
waar
de
HFE
gen
kan
zijn
gevonden
Aan
chromosoom
6.





2) Over
hoe
veel
genen
zijn
Aan
chromosoom
6?





3) Hoe?
lang
is
de
DNA
volgorde
voor
chromosoom
6?


ONS.
afdeling
van
Energie
Kantoor
van
biologisch
en
Milieu
Onderzoek


De
Gen
poort
Werkboek


Vragen voor Activiteit 3
1) Met behulp van
de
samenvatting
van
de
Entrez
Gen
dossier
voor
de
HFE
gen,
kort
beschrijven
de
functie
van
de
genen
eiwit
Product.



Gebruik de GenBank-reeksrecord Z92910.1 om vragen 2-4 te beantwoorden. 2) In de
Functies
sectie
van
dossier
Z92910.1,
selecteer
de
gen
koppeling.
Hoe
veel
baseren
paren
(bp)
zijn
in
de
genomisch
volgorde
van
de
HFE
gen?


3) Scrollen
door
de
Functies
sectie
van
de
gen
volgorde
in
Z92910.1.
Hoe
veel
exonen
hebben
geweest
geïdentificeerd
in
dit
volgorde?



4) Keer terug:
tot
de
hoofd
dossier
Z92910.1.
Selecteer
de
CDS
koppeling.
Hoe
veel
baseren
paren
zijn
in
de
codering
volgorde?


Wat
type
van
zakdoek
doet
niet
uitdrukken
de
HFE
eiwit?


Is
cysteïne
282
gevonden
Aan
de
extracellulair
of
cytoplasma
kant
van
de
HFE
eiwit?


Wat
is
de
nummer
van
de
cysteïne
residu
Dat
formulieren
een
disulfide
verbintenis
met
cysteïne
282?


Wat
vriendelijk
van
ondergeschikt
structureel
element
bevat
cysteïne
282:
alfa
helix,
draai,
of
bèta
strand?


ONS.
afdeling
van
Energie
Kantoor
van
biologisch
en
Milieu
Onderzoek


De
Gen
poort
Werkboek


ONS.
afdeling
van
Energie
Kantoor
van
biologisch
en
Milieu
Onderzoek


De
Gen
poort
Werkboek


Vragen voor Activiteit 5
1. Onderzoek
de
amino
zuur
volgorde
voor
de
menselijk
HFE
eiwit
van
de
UniProt
Eiwit
Kennis basis
(weergegeven)
onderstaand).
Vind
cysteïne
282,
de
amino
zuur
Dat
is
vervangen
door
tyrosine
in
de
CYS282TYR
mutatie.
Verwijzen
tot
de
Tafel
van
Standaard
genetisch
Code
Aan
Bladzijde
50
voor
helpen
met
de
enkele letter
amino
zuur
afkortingen.


10 20 30 40 50 60 | | | | | | MGPRARPALL LLMLLQTAVL QGRLLRSHSL HYLFMGASEQ DLGLSLFEAL GYVDDQLFVF 70 80 90 100 110 120 | | | | | | YDHESRRVEP RTPWVSSRIS SQMWLQLSQS LKGWDHMFTV DFWTIMENHN HSKESHTLQV 130 140 150 160 170 180 | | | | | | ILGCEMQEDN STEGYWKYGY DGQDHLEFCP DTLDWRAAEP RAWPTKLEWE RHKIRARQNR 190 200 210 220 230 240 | | | | | | AYLERDCPAQ LQQLLELGRG VLDQQVPPLV KVTHHVTSSV TTLRCRALNY YPQNITMKWL 250 260 270 280 290 300 | | | | | | KDKQPMDAKE FEPKDVLPNG DGTYQGWITL AVPPGEEQRY TCQVEHPGLD QPLIVIWEPS 310 320 330 340 | | | | PSGTLVIGVI SGIAVFVVIL FIGILFIILR KRQGSRGAMG HYVLAERE

2. Vergelijk
de
amino
zuur
volgorde
bovenstaand
met
de
HFE
volgorde
details
mits
voor
VOB
structuur
1A6Z.
In
vraag
1,
onderstrepen
de
deel
van
de
amino
zuur
volgorde
inbegrepen
in
de
VOB
structuur.



3. Hoe?
veel
disulfide
obligaties
zijn
Cadeau
in
de
erfgenaam
hemochromatose
eiwit?



4. Waarom?
is
de
cysteïne
residu
getroffen
in
de
CYS282TYR
mutatie
belangrijk?


Bekijk de video: Genom dan Genomics Bahasa Indonesia. BIOLOGI MOLEKULER #5 (December 2021).