Informatie

Hoeveel DNA van mensen waren betrokken bij de samenstelling van het menselijke referentiegenoom?


Ik weet dat het menselijke referentiegenoom is samengesteld uit DNA-delen van verschillende mensen, van wie de meesten Europees waren. Weet je hoeveel van hen erbij betrokken waren? Weet u welke er bij betrokken waren? Misschien zaten wetenschappers als het DNA van James Watson en George Church in het referentiegenoom. Ik zou ook aannemen dat het door de NIH gefinancierde referentiegenoom van het Human Genome Project enigszins moet verschillen van het privaat gefinancierde genoom.


tl;dr: In het Human Genome Project gebruikten ze het DNA van vier mensen (hoewel één man voor >70% van het DNA zorgde. Het Celera-genoom was samengesteld uit vijf mensen.

In het [… ] Human Genome Project (HGP), [… ] gebruikten wetenschappers witte bloedcellen uit het bloed van twee mannelijke en twee vrouwelijke donoren (willekeurig gekozen uit 20 van elk) -- elke donor leverde een aparte DNA-bibliotheek op. Een van deze bibliotheken (RP11 [anonieme donor uit Buffalo, NY]) werd vanwege kwaliteitsoverwegingen aanzienlijk meer gebruikt dan andere.

[… ]

In het particuliere project Celera Genomics werd DNA van vijf verschillende individuen gebruikt voor sequencing. De toenmalige hoofdwetenschapper van Celera Genomics, Craig Venter, erkende later (in een openbare brief aan het tijdschrift Science) dat zijn DNA een van de 21 monsters in de pool was, waarvan er vijf werden geselecteerd voor gebruik.

Op 4 september 2007 publiceerde een team onder leiding van Craig Venter zijn volledige DNA-sequentie [21] en onthulde voor de eerste keer het genoom van zes miljard nucleotiden van een enkel individu.)

Bron: Wikipedia


Biologie: classificatiesystemen

"Alle wetenschap is ofwel natuurkunde of postzegels verzamelen", verklaarde de in Nieuw-Zeeland geboren Engelse natuurkundige Ernest Rutherford (1871-1937). Terwijl Lord Rutherford voor de grap probeerde andere wetenschapsgebieden dan de zijne af te schaffen, bracht hij een waardevol inzicht over. Postzegels verzamelen is niet alleen het verzamelen van postzegels: de gewetensvolle verzamelaar legt orde op, hetzij op datum, nationaliteit, onderwerp, vorm of andere factoren. Analoog schept veel wetenschappelijk onderzoek orde in de wereld.

Er zijn veel classificatiewetenschappen: astronomen classificeren sterren, geologen, gesteentefysiologen, meteorologen van ziekten, stormen en chemici, moleculen. Sociale wetenschappers classificeren menselijk gedrag - zelfs wiskundigen classificeren. Maar de meest ontwikkelde classificatiesystemen zijn in de biologie ontstaan ​​om de natuurlijke wereld te classificeren.

Classificatie is essentieel voor rationeel denken. Alle taal legt een classificatie op in de toewijzing van woorden aan objecten. Zelfs dieren classificeren wanneer ze bijvoorbeeld verschillende alarmoproepen gebruiken als reactie op verschillende bedreigingen. Classificatie kan dus veilig worden toegeschreven aan de vroegste menselijke samenlevingen. De reflectieve articulatie van dergelijke kennis, de discipline taxonomie of systematiek, heeft echter een meer recente geschiedenis.


Inhoud

Encode werd in september 2003 gelanceerd door het Amerikaanse National Human Genome Research Institute (NHGRI). [2] [3] [4] [5] [6] Het ENCODE-project is bedoeld als vervolg op het Human Genome Project en heeft tot doel identificeren van alle functionele elementen in het menselijk genoom.

Bij het project is een wereldwijd consortium van onderzoeksgroepen betrokken en de gegevens die uit dit project worden gegenereerd, zijn toegankelijk via openbare databases. Het project begon zijn vierde fase in februari 2017. [7]

Mensen hebben naar schatting ongeveer 20.000 eiwitcoderende genen, die ongeveer 1,5% van het DNA in het menselijk genoom uitmaken. Het primaire doel van het ENCODE-project is het bepalen van de rol van de resterende component van het genoom, waarvan een groot deel traditioneel als "rommel" werd beschouwd. De activiteit en expressie van eiwitcoderende genen kunnen worden gemoduleerd door het reguloom - een verscheidenheid aan DNA-elementen, zoals promoters, transcriptionele regulerende sequenties en gebieden met chromatinestructuur en histonmodificatie. Men denkt dat veranderingen in de regulatie van genactiviteit de eiwitproductie en celprocessen kunnen verstoren en tot ziekte kunnen leiden. Het bepalen van de locatie van deze regulerende elementen en hoe ze gentranscriptie beïnvloeden, zou verbanden kunnen leggen tussen variaties in de expressie van bepaalde genen en de ontwikkeling van ziekte. [8]

ENCODE is ook bedoeld als een uitgebreide bron om de wetenschappelijke gemeenschap in staat te stellen beter te begrijpen hoe het genoom de menselijke gezondheid kan beïnvloeden, en om "de ontwikkeling van nieuwe therapieën te stimuleren om deze ziekten te voorkomen en te behandelen". [3]

Het ENCODE-consortium bestaat voornamelijk uit wetenschappers die werden gefinancierd door het Amerikaanse National Human Genome Research Institute (NHGRI). Andere deelnemers die bijdragen aan het project worden opgenomen in het consortium of de analysewerkgroep.

De pilotfase bestond uit acht onderzoeksgroepen en twaalf groepen die deelnamen aan de ENCODE Technology Development Phase. Na 2007 breidde het aantal deelnemers zich uit tot 440 wetenschappers in 32 laboratoria over de hele wereld, aangezien de proeffase officieel voorbij was. Op dit moment bestaat het consortium uit verschillende centra die verschillende taken uitvoeren.

ENCODE wordt momenteel geïmplementeerd in vier fasen: de pilotfase en de technologieontwikkelingsfase, die gelijktijdig [10] en de productiefase zijn gestart. De vierde fase is een voortzetting van de derde en omvat functionele karakterisering en verdere integratieve analyse voor de encyclopedie.

Het doel van de proeffase was om een ​​reeks procedures te identificeren die, in combinatie, kosteneffectief en met hoge doorvoer konden worden toegepast om grote delen van het menselijk genoom nauwkeurig en volledig te karakteriseren. De proeffase moest hiaten blootleggen in de huidige set hulpmiddelen voor het detecteren van functionele sequenties, en werd ook verondersteld te onthullen of sommige methoden die toen werden gebruikt inefficiënt of ongeschikt waren voor gebruik op grote schaal. Sommige van deze problemen moesten worden aangepakt in de ontwikkelingsfase van de ENCODE-technologie, die tot doel had nieuwe laboratorium- en rekenmethoden te bedenken die ons vermogen zouden verbeteren om bekende functionele sequenties te identificeren of om nieuwe functionele genomische elementen te ontdekken. De resultaten van de eerste twee fasen bepaalden de beste weg voorwaarts voor het analyseren van de resterende 99% van het menselijk genoom in een kosteneffectieve en uitgebreide productiefase. [3]

Het ENCODE Fase I-project: het proefproject Bewerken

De pilootfase testte en vergeleek bestaande methoden om een ​​bepaald deel van de menselijke genoomsequentie rigoureus te analyseren. Het werd georganiseerd als een open consortium en bracht onderzoekers met verschillende achtergronden en expertise samen om de relatieve verdiensten van elk van een diverse reeks technieken, technologieën en strategieën te evalueren. De gelijktijdige technologische ontwikkelingsfase van het project was gericht op de ontwikkeling van nieuwe high-throughput-methoden om functionele elementen te identificeren. Het doel van deze inspanningen was om een ​​reeks benaderingen te identificeren die de uitgebreide identificatie van alle functionele elementen in het menselijk genoom mogelijk zouden maken. Via het ENCODE-pilootproject heeft het National Human Genome Research Institute (NHGRI) de mogelijkheden van verschillende benaderingen beoordeeld om te worden opgeschaald voor een poging om het gehele menselijke genoom te analyseren en hiaten te vinden in het vermogen om functionele elementen in de genomische sequentie te identificeren.

Het ENCODE-pilootprojectproces omvatte nauwe interacties tussen computationele en experimentele wetenschappers om een ​​aantal methoden te evalueren voor het annoteren van het menselijk genoom. Een reeks regio's die ongeveer 1% (30 Mb) van het menselijk genoom vertegenwoordigen, werd geselecteerd als doelwit voor het proefproject en werd geanalyseerd door alle onderzoekers van het ENCODE-proefproject. Alle gegevens die door ENCODE-deelnemers over deze regio's werden gegenereerd, werden snel vrijgegeven in openbare databases. [5] [11]

Doelselectie bewerken

Voor gebruik in het ENCODE-pilootproject werden gedefinieerde gebieden van het menselijk genoom - overeenkomend met 30 Mb, ongeveer 1% van het totale menselijke genoom - geselecteerd. Deze regio's vormden de basis voor het testen en evalueren van de effectiviteit en efficiëntie van een diverse reeks methoden en technologieën voor het vinden van verschillende functionele elementen in het menselijk DNA.

Alvorens met de doelselectie te beginnen, werd besloten dat 50% van de 30 MB sequentie handmatig zou worden geselecteerd, terwijl de resterende sequentie willekeurig zou worden geselecteerd. De twee belangrijkste criteria voor handmatig geselecteerde regio's waren: 1) de aanwezigheid van goed bestudeerde genen of andere bekende sequentie-elementen, en 2) het bestaan ​​van een aanzienlijke hoeveelheid vergelijkende sequentiegegevens. Een totaal van 14,82 Mb sequentie werd handmatig geselecteerd met behulp van deze aanpak, bestaande uit 14 doelen die in grootte variëren van 500 kb tot 2 Mb.

De resterende 50% van de sequentie van 30 Mb was samengesteld uit dertig regio's van 500 kb die waren geselecteerd volgens een gestratificeerde strategie voor willekeurige bemonstering op basis van gendichtheid en het niveau van niet-exonische conservering. De beslissing om deze specifieke criteria te gebruiken werd genomen om een ​​goede bemonstering te verzekeren van genomische regio's die sterk variëren in hun gehalte aan genen en andere functionele elementen. Het menselijk genoom was verdeeld in drie delen - bovenste 20%, middelste 30% en onderste 50% - langs elk van twee assen: 1) gendichtheid en 2) niveau van niet-exonische conservering met betrekking tot de orthologe genoomsequentie van muizen ( zie hieronder), voor een totaal van negen lagen. Uit elke laag zijn drie willekeurige regio's gekozen voor het proefproject. Voor de lagen die ondervertegenwoordigd waren door de handmatige selectie, werd een vierde regio gekozen, wat resulteert in een totaal van 30 regio's. Voor alle lagen werd een "backup"-regio aangewezen voor gebruik in geval van onvoorziene technische problemen.

Meer in detail waren de stratificatiecriteria als volgt:

    dichtheid: De gendichtheidsscore van een regio was het percentage basen dat werd gedekt door genen in de Ensembl-database, of door menselijke mRNA beste BLAT (BLAST-achtige uitlijningstool) uitlijningen in de UCSC Genome Browser-database.
  • Niet-exonische conservering: het gebied was verdeeld in niet-overlappende subvensters van 125 basen. Subvensters die minder dan 75% basenuitlijning met muissequentie vertoonden, werden weggegooid. Voor de overige subvensters was het percentage met ten minste 80% base-identiteit met muis en dat niet overeenkwam met Ensembl-genen, GenBankmRNA BLASTZ-uitlijningen, Fgenesh++-genvoorspellingen, TwinScan-genvoorspellingen, gesplitste EST-uitlijningen of herhaalde sequenties (DNA). gebruikt als de niet-exonische conserveringsscore.

De bovenstaande scores werden berekend binnen niet-overlappende 500 kb-vensters van voltooide sequentie over het genoom en gebruikt om elk venster aan een stratum toe te wijzen. [12]

Resultaten pilotfase bewerken

De pilotfase is succesvol afgerond en de resultaten zijn in juni 2007 gepubliceerd in Natuur [5] en in een speciale uitgave van Genoomonderzoek [13] de resultaten die in het eerste genoemde artikel zijn gepubliceerd, hebben de collectieve kennis over de functie van het menselijk genoom op verschillende belangrijke gebieden verbeterd, waaronder de volgende hoogtepunten: [5]

  • Het menselijke genoom wordt alom getranscribeerd, zodat de meerderheid van zijn basen is geassocieerd met ten minste één primair transcript en veel transcripten distale regio's verbinden met gevestigde eiwitcoderende loci.
  • Er zijn veel nieuwe niet-eiwitcoderende transcripten geïdentificeerd, waarbij veel van deze overlappende eiwitcoderende loci en andere zich bevinden in regio's van het genoom waarvan eerder werd gedacht dat ze transcriptioneel stil waren.
  • Talloze voorheen niet-herkende startplaatsen voor transcriptie zijn geïdentificeerd, waarvan vele een chromatinestructuur en sequentiespecifieke eiwitbindende eigenschappen vertonen die vergelijkbaar zijn met goed begrepen promotors.
  • Regulerende sequenties die transcriptiestartplaatsen omringen, zijn symmetrisch verdeeld, zonder voorkeur voor stroomopwaartse regio's. toegankelijkheid en histonmodificatiepatronen zijn zeer voorspellend voor zowel de aanwezigheid als de activiteit van transcriptiestartplaatsen.
  • Distale DNaseI-overgevoelige plaatsen hebben karakteristieke histonmodificatiepatronen die hen op betrouwbare wijze onderscheiden van promotors. Sommige van deze distale plaatsen vertonen markeringen die consistent zijn met de isolatorfunctie. timing is gecorreleerd met de chromatinestructuur.
  • Een totaal van 5% van de basen in het genoom kan met vertrouwen worden geïdentificeerd als zijnde onder evolutionaire beperking bij zoogdieren voor ongeveer 60% van deze beperkte basen, er is bewijs van functie op basis van de resultaten van de experimentele testen die tot nu toe zijn uitgevoerd.
  • Hoewel er algemene overlap is tussen genomische regio's die door experimentele tests als functioneel zijn geïdentificeerd en die onder evolutionaire beperking, vertonen niet alle basen binnen deze experimenteel gedefinieerde regio's bewijs van beperking.
  • Verschillende functionele elementen variëren sterk in hun sequentievariabiliteit over de menselijke populatie en in hun waarschijnlijkheid om in een structureel variabel gebied van het genoom te verblijven.
  • Verrassend genoeg zijn veel functionele elementen schijnbaar onbeperkt in de evolutie van zoogdieren. Dit suggereert de mogelijkheid van een grote pool van neutrale elementen die biochemisch actief zijn maar geen specifiek voordeel voor het organisme bieden. Deze pool kan dienen als een 'magazijn' voor natuurlijke selectie, mogelijk als de bron van afstammingsspecifieke elementen en functioneel geconserveerde maar niet-orthologe elementen tussen soorten.

Het ENCODE Fase II-project: het productiefaseproject Bewerken

In september 2007 begon het National Human Genome Research Institute (NHGRI) met de financiering van de productiefase van het ENCODE-project. In deze fase was het doel om het volledige genoom te analyseren en "aanvullende pilot-scale studies" uit te voeren. [14]

Net als in het proefproject is de productie-inspanning georganiseerd als een open consortium. In oktober 2007 heeft NHGRI in vier jaar tijd in totaal meer dan $ 80 miljoen aan subsidies toegekend. [15] De productiefase omvat ook een gegevenscoördinatiecentrum, een gegevensanalysecentrum en een inspanning voor technologische ontwikkeling. [16] Op dat moment evolueerde het project tot een werkelijk wereldwijde onderneming, waarbij 440 wetenschappers uit 32 laboratoria over de hele wereld betrokken waren. Nadat de proeffase was voltooid, is het project in 2007 'opgeschaald' en enorm geprofiteerd van de nieuwe generatie sequencing-machines. En de gegevens waren inderdaad, grote onderzoekers genereerden ongeveer 15 terabyte aan onbewerkte gegevens.

In 2010 waren door het ENCODE-project meer dan 1.000 genoombrede datasets geproduceerd. Alles bij elkaar genomen laten deze datasets zien welke regio's worden getranscribeerd in RNA, welke regio's waarschijnlijk de genen controleren die in een bepaald type cel worden gebruikt, en welke regio's worden geassocieerd met een grote verscheidenheid aan eiwitten. De primaire tests die in ENCODE worden gebruikt, zijn ChIP-seq, DNase I-overgevoeligheid, RNA-seq en tests van DNA-methylatie.

Resultaten productiefase Bewerken

In september 2012 heeft het project een veel uitgebreidere reeks resultaten vrijgegeven, in 30 artikelen die gelijktijdig in verschillende tijdschriften zijn gepubliceerd, waaronder zes in Natuur, zes inch Genoombiologie en een speciale uitgave met 18 publicaties van Genoomonderzoek. [17]

De auteurs beschreven de productie en de eerste analyse van 1640 datasets die zijn ontworpen om functionele elementen in het gehele menselijke genoom te annoteren, waarbij de resultaten van verschillende experimenten binnen celtypen worden geïntegreerd, gerelateerde experimenten met 147 verschillende celtypen en alle ENCODE-gegevens met andere bronnen, zoals als kandidaat-regio's uit genoombrede associatiestudies (GWAS) en evolutionair beperkte regio's. Samen brachten deze inspanningen belangrijke kenmerken aan het licht over de organisatie en functie van het menselijk genoom, die als volgt in een overzichtsdocument werden samengevat: [18]

  1. De overgrote meerderheid (80,4%) van het menselijk genoom neemt deel aan ten minste één biochemische RNA- en/of chromatine-geassocieerde gebeurtenis in ten minste één celtype. Een groot deel van het genoom ligt dicht bij een regulerende gebeurtenis: 95% van het genoom ligt binnen 8 kb van een DNA-eiwit-interactie (zoals bepaald door gebonden ChIP-seq-motieven of DNaseI-footprints), en 99% bevindt zich binnen 1,7 kb van ten minste één van de biochemische gebeurtenissen gemeten door ENCODE.
  2. Zowel primaat-specifieke elementen als elementen zonder aantoonbare beperking van zoogdieren tonen in totaal bewijs van negatieve selectie, dus wordt verwacht dat sommige ervan functioneel zijn.
  3. Het classificeren van het genoom in zeven chromatinetoestanden suggereert een eerste set van 399.124 regio's met enhancer-achtige kenmerken en 70.292 regio's met promotorachtige kenmerken, evenals honderdduizenden rustige regio's. Analyses met hoge resolutie verdelen het genoom verder in duizenden smalle toestanden met verschillende functionele eigenschappen.
  4. Het is mogelijk om de productie en verwerking van RNA-sequenties kwantitatief te correleren met zowel chromatine-markeringen als transcriptiefactor (TF) -binding aan promoters, wat aangeeft dat de functionaliteit van de promoter het grootste deel van de variatie in RNA-expressie kan verklaren.
  5. Veel niet-coderende varianten in individuele genoomsequenties liggen in ENCODE-geannoteerde functionele regio's, dit aantal is minstens zo groot als die in eiwitcoderende genen. geassocieerd met ziekte door GWAS zijn verrijkt met niet-coderende functionele elementen, met een meerderheid in of nabij ENCODE-gedefinieerde regio's die zich buiten de eiwitcoderende genen bevinden. In veel gevallen kunnen de ziektefenotypen worden geassocieerd met een specifiek celtype of TF.

De meest opvallende bevinding was dat de fractie van menselijk DNA die biologisch actief is aanzienlijk hoger is dan zelfs de meest optimistische eerdere schattingen. In een overzichtsartikel rapporteerde het ENCODE Consortium dat zijn leden in staat waren om biochemische functies toe te kennen aan meer dan 80% van het genoom. [18] Veel hiervan bleek betrokken te zijn bij het beheersen van de expressieniveaus van coderend DNA, dat minder dan 1% van het genoom uitmaakt.

De belangrijkste nieuwe elementen van de "encyclopedie" zijn onder meer:

  • Een uitgebreide kaart van overgevoelige DNase 1-plaatsen, die markers zijn voor regulerend DNA dat zich doorgaans naast genen bevindt en waardoor chemische factoren hun expressie kunnen beïnvloeden. De kaart identificeerde bijna 3 miljoen sites van dit type, waaronder bijna alle die eerder bekend waren en vele die nieuw zijn. [19]
  • Een lexicon van korte DNA-sequenties die herkenningsmotieven vormen voor DNA-bindende eiwitten. Er werden ongeveer 8,4 miljoen van dergelijke sequenties gevonden, die een fractie van het totale DNA omvatten, ruwweg tweemaal de grootte van het exoom. Duizenden transcriptiepromotors bleken gebruik te maken van een enkele stereotiepe voetafdruk van 50 basenparen. [20]
  • Een voorlopige schets van de architectuur van het netwerk van menselijke transcriptiefactoren, dat wil zeggen factoren die aan DNA binden om de expressie van genen te bevorderen of te remmen. Het netwerk bleek behoorlijk complex te zijn, met factoren die op verschillende niveaus werken, evenals talrijke feedbackloops van verschillende typen. [21]
  • Een meting van de fractie van het menselijk genoom die in RNA kan worden getranscribeerd.Deze fractie werd geschat op meer dan 75% van het totale DNA, een veel hogere waarde dan eerdere schattingen. Het project begon ook met het karakteriseren van de soorten RNA-transcripten die op verschillende locaties worden gegenereerd. [22]

Gegevensbeheer en -analyse Bewerken

Het vastleggen, opslaan, integreren en weergeven van de diverse gegenereerde gegevens is een uitdaging. Het ENCODE Data Coördinatie Centrum (DCC) organiseert en toont de gegevens die worden gegenereerd door de laboratoria in het consortium, en zorgt ervoor dat de gegevens voldoen aan specifieke kwaliteitsnormen wanneer ze worden vrijgegeven voor het publiek. Voordat een lab data aanlevert, stellen het DCC en het lab een data-overeenkomst op waarin de experimentele parameters en bijbehorende metadata worden vastgelegd. Het DCC valideert binnenkomende gegevens om consistentie met de overeenkomst te waarborgen. Het zorgt er ook voor dat alle gegevens worden geannoteerd met behulp van de juiste ontologieën. [23] Vervolgens laadt het de gegevens op een testserver voor voorlopige inspectie en coördineert het met de laboratoria om de gegevens in een consistente reeks sporen te ordenen. Wanneer de tracks klaar zijn, voert het DCC Quality Assurance-team een ​​reeks integriteitscontroles uit, controleert het of de gegevens worden gepresenteerd op een manier die consistent is met andere browsergegevens, en misschien wel het belangrijkste, verifieert dat de metagegevens en de bijbehorende beschrijvende tekst worden gepresenteerd in een manier die nuttig is voor onze gebruikers. De gegevens worden pas vrijgegeven op de openbare UCSC Genome Browser-website nadat aan al deze controles is voldaan. Tegelijkertijd worden de gegevens geanalyseerd door het ENCODE Data Analysis Center, een consortium van analyseteams van de verschillende productielaboratoria en andere onderzoekers. Deze teams ontwikkelen gestandaardiseerde protocollen om gegevens van nieuwe assays te analyseren, beste praktijken te bepalen en een consistente set van analytische methoden te produceren, zoals gestandaardiseerde piekoproepers en signaalgeneratie van uitlijningsstapel-ups. [24]

Het National Human Genome Research Institute (NHGRI) heeft ENCODE geïdentificeerd als een "community resource project". Dit belangrijke concept werd gedefinieerd tijdens een internationale bijeenkomst in Ft. Lauderdale in januari 2003 als een onderzoeksproject dat specifiek is bedacht en uitgevoerd om een ​​reeks gegevens, reagentia of ander materiaal te creëren waarvan het primaire nut zal zijn als hulpbron voor de brede wetenschappelijke gemeenschap. Dienovereenkomstig bepaalt het ENCODE-beleid voor het vrijgeven van gegevens dat gegevens, zodra ze zijn geverifieerd, worden gedeponeerd in openbare databases en beschikbaar worden gesteld voor gebruik door iedereen zonder beperkingen. [24]

Met de voortzetting van de derde fase is het ENCODE Consortium betrokken geraakt bij aanvullende projecten waarvan de doelstellingen parallel lopen aan het ENCODE-project. Sommige van deze projecten maakten deel uit van de tweede fase van ENCODE.

ModENCODE-project Bewerken

Het MODel-organisme ENCyclopedia Of DNA Elements (modENCODE)-project is een voortzetting van het oorspronkelijke ENCODE-project dat gericht is op de identificatie van functionele elementen in geselecteerde genomen van modelorganismes, met name Drosophila melanogaster en Caenorhabditis elegans. [25] De uitbreiding naar modelorganismen maakt biologische validatie van de computationele en experimentele bevindingen van het ENCODE-project mogelijk, iets dat bij mensen moeilijk of onmogelijk is. [25] Financiering voor het modENCODE-project werd in 2007 aangekondigd door de National Institutes of Health (NIH) en omvatte verschillende onderzoeksinstellingen in de VS. [26] [27] Het project voltooide zijn werk in 2012.

Eind 2010 onthulde het modENCODE-consortium zijn eerste reeks resultaten met publicaties over annotatie en integratieve analyse van de genomen van wormen en vliegen in Wetenschap. [28] [29] Gegevens van deze publicaties zijn beschikbaar op de modENCODE-website. [30]

modENCODE werd gerund als een onderzoeksnetwerk en het consortium werd gevormd door 11 primaire projecten, verdeeld over worm en vlieg. De projecten besloegen het volgende:

  • genstructuur
  • mRNA- en ncRNA-expressieprofilering
  • Transcriptiefactor bindingsplaatsen
  • Histon-modificaties en vervanging
  • chromatine structuur
  • Initiatie en timing van DNA-replicatie
  • Kopieer nummer variatie. [31]

ModERN Bewerken

modERN, een afkorting voor de modelorganisme-encyclopedie van regulerende netwerken, vertakt van het modENCODE-project. Het project heeft de C. elegans- en Drosophila-groepen samengevoegd en richt zich op de identificatie van aanvullende transcriptiefactorbindingsplaatsen van de respectieve organismen. Het project begon op hetzelfde moment als Fase III van ENCODE en is van plan om in 2017 te eindigen. [32] Tot op heden heeft het project 198 experimenten vrijgegeven, [33] met ongeveer 500 andere experimenten die zijn ingediend en momenteel worden verwerkt door het DCC.

Genomica van genregulatie Bewerken

Begin 2015 lanceerde de NIH het programma Genomics of Gene Regulation (GGR). [34] Het doel van het programma, dat drie jaar zal duren, is om gennetwerken en paden in verschillende systemen van het lichaam te bestuderen, in de hoop de mechanismen die genexpressies beheersen beter te begrijpen. Hoewel het ENCODE-project los staat van GGR, heeft het ENCODE DCC GGR-gegevens gehost in het ENCODE-portaal. [35]

Routekaart bewerken

In 2008 startte de NIH het Roadmap Epigenomics Mapping Consortium, dat tot doel had om "een openbare bron van menselijke epigenomische gegevens te produceren om basisbiologie en ziektegericht onderzoek te katalyseren". [36] In februari 2015 bracht het consortium een ​​artikel uit met de titel "Integrative analysis of 111 reference human epigenomes", waarmee het doel van het consortium werd bereikt. Het consortium integreerde informatie en geannoteerde regelgevende elementen in 127 referentie-epigenomen, waarvan 16 deel uitmaakten van het ENCODE-project. [37] Gegevens voor het Roadmap-project zijn te vinden in de Roadmap-portal of ENCODE-portal.

FruitENCODE-project Bewerken

De fruitENCODE: een encyclopedie van DNA-elementen voor fruitrijping is een plant ENCODE-project dat tot doel heeft DNA-methylatie, histonmodificaties, DHS, genexpressie, transcriptiefactorbindingsdatasets te genereren voor alle vlezige fruitsoorten in verschillende ontwikkelingsstadia. Prerelease-gegevens zijn te vinden in de fruitENCODE-portal.

Hoewel het consortium beweert dat ze nog lang niet klaar zijn met het ENCODE-project, waren veel reacties op de gepubliceerde papers en de berichtgeving die gepaard ging met de release positief. De redacteuren van Nature en de auteurs van ENCODE "hebben maandenlang samengewerkt om de grootst mogelijke plons te maken en de aandacht te trekken van niet alleen de onderzoeksgemeenschap, maar ook van het grote publiek". [38] De bewering van het ENCODE-project dat 80% van het menselijk genoom een ​​biochemische functie heeft [18] werd snel opgepikt door de populaire pers, die de resultaten van het project beschreef als leidend tot de dood van junk-DNA. [39] [40]

De conclusie dat het grootste deel van het genoom "functioneel" is, is echter bekritiseerd omdat het ENCODE-project een liberale definitie van "functioneel" gebruikte, namelijk alles dat wordt getranscribeerd, moet functioneel zijn. Deze conclusie werd getrokken ondanks de algemeen aanvaarde opvatting, gebaseerd op schattingen van genomische conservering van vergelijkende genomica, dat veel DNA-elementen, zoals pseudogenen die worden getranscribeerd, toch niet-functioneel zijn. Bovendien heeft het ENCODE-project de nadruk gelegd op gevoeligheid boven specificiteit, wat mogelijk heeft geleid tot de detectie van veel valse positieven. [41] [42] [43] Enigszins willekeurige keuze van cellijnen en transcriptiefactoren evenals het ontbreken van geschikte controle-experimenten waren aanvullende belangrijke kritieken op ENCODE, aangezien willekeurig DNA ENCODE-achtig 'functioneel' gedrag nabootst. [44]

Als reactie op sommige van de kritieken voerden andere wetenschappers aan dat de wijdverbreide transcriptie en splicing die rechtstreeks in het menselijk genoom wordt waargenomen door biochemische tests, een nauwkeuriger indicator is van de genetische functie dan schattingen van genomische instandhouding, omdat schattingen van instandhouding allemaal relatief en moeilijk te uitlijnen vanwege ongelooflijke variaties in genoomgroottes van zelfs nauw verwante soorten, is het gedeeltelijk tautologisch en deze schattingen zijn niet gebaseerd op directe tests voor functionaliteit op het genoom. [45] [46] Instandhoudingsschattingen kunnen worden gebruikt om aanwijzingen te geven om mogelijke functionele elementen in het genoom te identificeren, maar het beperkt of begrenst niet de totale hoeveelheid functionele elementen die mogelijk in het genoom zouden kunnen voorkomen. [46] Bovendien lijkt een groot deel van het genoom dat door critici wordt betwist, betrokken te zijn bij epigenetische regulatie zoals genexpressie en lijkt het noodzakelijk voor de ontwikkeling van complexe organismen. [45] [47] De ENCODE-resultaten waren niet per se onverwacht, aangezien de toename van de toewijzing van functionaliteit werd voorafschaduwd door eerdere decennia van onderzoek. [45] [47] Bovendien hebben anderen opgemerkt dat het ENCODE-project vanaf het allereerste begin een reikwijdte had die was gebaseerd op het zoeken naar biomedisch relevante functionele elementen in het genoom en niet op evolutionaire functionele elementen, die niet noodzakelijk hetzelfde zijn, aangezien evolutionaire selectie niet voldoende of noodzakelijk om een ​​functie te vestigen. Het is een zeer nuttige proxy voor relevante functies, maar een onvolmaakte en niet de enige. [48]

In reactie op de klachten over de definitie van het woord "functie" hebben sommigen opgemerkt dat ENCODE definieerde wat het betekende en aangezien de reikwijdte van ENCODE zocht naar biomedisch relevante functionele elementen in het genoom, dan moet de conclusie van het project worden geïnterpreteerd "door te zeggen dat 80 % van het genoom betrokken is bij relevante biochemische activiteiten die zeer waarschijnlijk een oorzakelijke rol spelen in fenomenen die relevant worden geacht voor biomedisch onderzoek." [48] ​​De kwestie van de functie gaat meer over definitieverschillen dan over de kracht van het project, dat gegevens leverde voor verder onderzoek naar de biochemische activiteit van niet-eiwitcoderende delen van DNA. Hoewel definities belangrijk zijn en de wetenschap wordt begrensd door de grenzen van de taal, lijkt het erop dat ENCODE goed is ontvangen voor zijn doel, aangezien er nu meer onderzoekspapers zijn die ENCODE-gegevens gebruiken dan artikelen die ruzie maken over de definitie van functie, vanaf maart 2013 [49] Ewan Birney, een van de ENCODE-onderzoekers, merkte op dat "functie" pragmatisch werd gebruikt om "specifieke biochemische activiteit" te betekenen, waaronder verschillende klassen van tests: RNA, "brede" histon-modificaties, "smalle" histon-modificaties, DNaseI overgevoelige sites, transcriptiefactor ChIP-seq-pieken, DNaseI-voetafdrukken, aan transcriptiefactor gebonden motieven en Exons. [50]

In 2014 merkten ENCODE-onderzoekers op dat in de literatuur functionele delen van het genoom in eerdere onderzoeken anders zijn geïdentificeerd, afhankelijk van de gebruikte benaderingen. Er zijn drie algemene benaderingen gebruikt om functionele delen van het menselijk genoom te identificeren: genetische benaderingen (die afhankelijk zijn van veranderingen in fenotype), evolutionaire benaderingen (die afhankelijk zijn van conservering) en biochemische benaderingen (die afhankelijk zijn van biochemische tests en werden gebruikt door ENCODE) . Alle drie hebben beperkingen: genetische benaderingen kunnen functionele elementen missen die zich niet fysiek op het organisme manifesteren, evolutionaire benaderingen hebben problemen met het gebruik van nauwkeurige multispecies-sequentie-uitlijningen aangezien genomen van zelfs nauw verwante soorten aanzienlijk variëren, en met biochemische benaderingen, hoewel ze een hoge reproduceerbaarheid hebben, is de biochemische handtekeningen betekenen niet altijd automatisch een functie. Ze concludeerden dat, in tegenstelling tot evolutionair en genetisch bewijs, biochemische gegevens aanwijzingen bieden over zowel de moleculaire functie van onderliggende DNA-elementen als de celtypen waarin ze werken, en dat uiteindelijk alle drie de benaderingen op een complementaire manier kunnen worden gebruikt om regio's te identificeren die mogelijk functioneel zijn in de menselijke biologie en ziekte. Bovendien merkten ze op dat de biochemische kaarten van ENCODE de meest waardevolle dingen van het project waren, omdat ze een startpunt bieden om te testen hoe deze handtekeningen zich verhouden tot de moleculaire, cellulaire en organismale functie. [46]

Het project is ook bekritiseerd vanwege de hoge kosten (

400 miljoen dollar in totaal) en de voorkeur geven aan grote wetenschap die geld weghaalt van zeer productief door onderzoekers geïnitieerd onderzoek. [51] Het pilot-ENCODE-project kostte naar schatting $ 55 miljoen, de opschaling was ongeveer $ 130 miljoen en het Amerikaanse National Human Genome Research Institute NHGRI zou tot $ 123 miljoen kunnen toekennen voor de volgende fase. Sommige onderzoekers beweren dat een solide rendement op die investering nog moet worden gezien. Er zijn pogingen geweest om de literatuur te doorzoeken op de artikelen waarin ENCODE een belangrijke rol speelt en sinds 2012 zijn er 300 artikelen geweest, waarvan 110 afkomstig van laboratoria zonder ENCODE-financiering. Een bijkomend probleem is dat ENCODE geen unieke naam is die exclusief aan het ENCODE-project is gewijd, dus het woord 'encode' komt in veel literatuur over genetica en genomica voor. [52]

Een andere belangrijke kritiek is dat de resultaten de hoeveelheid tijd die aan het project wordt besteed niet rechtvaardigen en dat het project zelf in wezen onafgemaakt is. Hoewel het vaak wordt vergeleken met het Human Genome Project (HGP) en zelfs de volgende stap van het HGP wordt genoemd, had het HGP een duidelijk eindpunt dat ENCODE momenteel mist.

De auteurs lijken te sympathiseren met de wetenschappelijke zorgen en proberen tegelijkertijd hun inspanningen te rechtvaardigen door interviews te geven en ENCODE-details uit te leggen, niet alleen aan het wetenschappelijke publiek, maar ook aan de massamedia. Ze beweren ook dat het meer dan een halve eeuw heeft geduurd vanaf het besef dat DNA het erfelijke materiaal van het leven is tot de menselijke genoomsequentie, zodat hun plan voor de volgende eeuw zou zijn om de sequentie zelf echt te begrijpen. [52]


Nuevos genomas bewezen una referencia para la diversidad genetica humana

En 2001, het Consorcio Internacional de Secuenciación del Genoma Humano aangekondigd door de primer borrador de la secuencia de referencia del genoma humano. El Proyecto Genoma Humano heeft meer dan eens de trabajo en involucó een meer dan 1000 wetenschappelijke de 40 países. Er is een secuencia de referencia, een zonde-embargo, geen representa a una sola persona, sino que es un combinación de humanos, que no puede capturar con precisión la complejidad de la variación genetica humana.

Sobre esta base, durante los últimos 20 años, se han llevado a cabo muchos proyectos de secuenciación para identificar y catalogar las diferencias geneticas andtre un individuele y el genoma de referencia. Deze verschillen zijn algemeen van aard en bestaan ​​uit een enkele basis en een pasaban door alto alteraciones geneticas más grandes. De nieuwste technologische ontwikkelingen en kenmerken van verschillende soorten hebben veel betekenis, lama's, estructurale varianten, en verschillende soorten letras. Verschillende estructurale varianten zijn waarschijnlijk van invloed op de werking van de genetica van verschillende soorten genen.

De onderzoeksgroep van het EMBL-lidmaatschap door Jan Korbel, en de vereniging met de Universidad Heinrich Heine de Düsseldorf, het Laboratorio Jackson en Farmington, Connecticut, de Universidad de Washington en Seattle, hebben gepubliceerde artikelen en een recente wetenschappelijke publicatie een nieuw gekoppeld aan de referenties van veel meer dan een volledig gebruik van een combinatie van technische gegevens van secuenciación en mapeo. Er is een nieuw verband tussen de referentiegegevens en 64 genomas humanos ensamblados, que representan 25 poblaciones humanas diferentes de África, America del Norte, Asia Oriental en Meridional, en Europa.

Este estudio is gebaseerd op een nieuw onderzoek naar het onderzoek naar een nieuw onderzoek naar de natuurbiotechnologie voor de reconstructie van de exacte componenten van het genoom van de persona: de heredado van de voorouders. Al ensamblar el genoma de una persona, este método utiliza una technología desarrollada el EMBL (denominada Strand-seq) para distinguir las secuencias de ADN paternas y maternas.

“Para cada persona que ha participado en el estudio, identificamos no uno, sino dos genomas, uno para cada conjunto de cromosomas”, explica Jan Korbel, quien dirigió la investigación en el EMBL. “Los seres humanos tenemos dos conjuntos de los cromosomas que recibimos de nuestros padres. Anteriormente, no podíamos distinguir si la variación genetica provenía de los cromosomas del uno o del otro. En cambio, gracias a los avances realizados el Consorcio de Variación Estructural del Genoma Humano, ahora sí hemos sido capaces de hacerlo. Dit is een extraordinaire procedure voor de genetische variatie en humanos, die een menselijke oorsprong is die veel meer completeert, voor een volledige beschrijving van de genen die veroorzaakt worden door enfermedades'8221.

De distributie van genetische varianten is mogelijk tussen de verschillende groepen die de resultaten van de cambio's espontáneos en het optreden van voortzetting van de materiële genetica bevatten. Dit is een mutatie die kan worden overgedragen aan de meeste van de generaciones, puede convertirse en una variante genetica específica de esa población.

Losse verwijzingen naar een basis van belangrijke inclusieve en losstaande estudio's voor de associatie van het genoom en van het volledige spectrum van genetische varianten. Het doel van de schatting van de individuele prestaties van de kanker en het comprender van de mechanische moleculaire subyacentes. Dit is een goed voorbeeld van een gebruiksvriendelijke basis voor terapias met betrekking tot dirigidas en medicina preventiva.

Este trabajo podría permitir nuevas aplicaciones en la medicina de precisión. De eficacia van een boerderij, door ejemplo, puede variar tussen individuele en función de sus genomas. Losse gegevens van referenties vertegenwoordigen het volledige gamma van verschillende genetische varianten en opgenomen menselijke genoma's van verschillende soorten. "Estos genomas abrirán el camino hacia una ola de descubrimientos científicos sobre la biología del genoma humano y la conexión andtre variación genetica y enfermedades", dobbelstenen el investigador del EMBL en co-primer auto-Bernardo Martín. “Como ejemplo, hemos podido estimar la edad de las repeticiones altamente mutagénicas de L1. Er zijn verschillende soorten ontstaan ​​die oorspronkelijk uit een groot aantal millones de komende jaren voortkwamen, waarbij het menselijk genoom zich voortzette met de frecuencia, die samen een mogelijke oorzaak van kanker veroorzaakt”. Dit is een nieuwe manier om een ​​bijdrage te leveren aan de ontwikkeling van nieuwe medische behandelingen, en de selectie van de terapia's die zich hebben voorgedaan in de geschiedenis van de individuele geneeskunde.


Crowdsourcing

Een belangrijke implicatie van de vooruitgang in sequencing-technologie is de opkomst van genetische testkits voor thuis, zoals 23andMe. Hoewel dergelijke tests niet het hele genoom sequencen, is hun succes mogelijk gemaakt door de lage kosten van NGS en de beschikbaarheid van moderne sequencing-technologieën. Veel mensen gebruiken deze kits om meer te weten te komen over hun afkomst en mogelijke gezondheidsrisico's die in hun DNA staan ​​geschreven. Onderzoekers hebben echter een andere mogelijkheid gevonden in diensten zoals 23andMe.

Met een breed scala aan gebruikers en toegang tot een aantal genetische varianten, moedigt 23andMe haar klanten aan om deel te nemen aan verschillende onderzoeksprojecten. Veel van deze projecten omvatten een reeks enquêtevragen over specifieke eigenschappen die variëren van het enigszins grillige 'kun je een zijsplit doen?' tot de meer ernstige familiegeschiedenis van een ziekte of ziekte. Datawetenschappers en onderzoekers gebruiken de onderzoeksresultaten vervolgens om vergelijkbare groepen individuen samen te clusteren op basis van de mutaties die ze vinden in de sequentiegegevens. Deze resultaten kunnen worden gebruikt om betere voorspellingsmodellen van verschillende eigenschappen te bouwen en om klanten meer accurate en nuttige informatie te geven, zoals potentiële gezondheidsrisico's. Bijvoorbeeld, gebruikers die aangeven een familiegeschiedenis van borstkanker te hebben, zouden allemaal hun DNA-sequenties hebben vergeleken met het voorspellen van segmenten of mutaties van DNA die correleren met de ziekte.


Inhoud

Campus bewerken

In 1993 verhuisden de toen 17 medewerkers van het Sanger Center naar een tijdelijke laboratoriumruimte in Hinxton Hall in Cambridgeshire. [6] Deze locatie van 220.000 m 2 van 55 hectare zou de Wellcome Genome Campus worden, met een groeiende populatie van ongeveer 1300 medewerkers, van wie er ongeveer 900 werken bij het Sanger Institute. [7] De Genome Campus omvat ook het Wellcome Trust Conference Centre [8] en het European Bioinformatics Institute. In 2005 werd een grote uitbreiding van de campus officieel geopend [9] de gebouwen herbergen nieuwe laboratoria, een datacenter en personeelsvoorzieningen. [10] Bij het bespreken van de naam van het centrum, vertelde Sanger (nog in leven toen het centrum werd geopend) John Sulston, de oprichter van het centrum, dat het centrum "beter goed zou zijn." Sulston merkte op: "Ik wou dat ik het niet had gevraagd." [11]

Sequentie bewerken

De sequencingmedewerkers van het Sanger Institute verwerken wekelijks miljoenen DNA-monsters. [ citaat nodig ] Het Instituut "kapitaliseert op geavanceerde technologieën om vragen te beantwoorden die slechts een paar jaar geleden nog niet konden worden beantwoord". [12] Dankzij de technologische vooruitgang kan het Sanger Institute de genomen van individuele mensen, gewervelde soorten en pathogenen in een steeds hoger tempo en tegen lagere kosten sequencen. Het instituut heeft meer dan 100 lopende projecten voor de sequentiebepaling van pathogenen. [13] De output van het Sanger Institute is ongeveer 10 miljard basen aan onbewerkte sequentiegegevens per dag. [14]

Wetenschappelijke bronnen Bewerken

Bronnen voor bio-informaticadatabases zijn een van de resultaten van onderzoeksprogramma's waarbij het Sanger Institute betrokken is. De programma's die door het Sanger Institute worden gehost, zijn onder meer:

    , [15] een catalogus van somatische mutaties bij kanker, een database van chromosomale onbalans en fenotype bij mensen, met behulp van Ensembl-bronnen [16], [17] een genoombrowser die mede wordt gehost door het European Bioinformatics Institute.
  • GeneDB, [18] een database met sequenties van pathogenen, inclusief een database met gestandaardiseerde fenotypische analyse voor vele honderden mutante muizen. , [19] een annotatiebron voor het genoom van gewervelde dieren

Verschillende databases zijn gestart bij het Sanger Institute, maar worden nu elders gehost:

    , [20] een peptidase-database, [21] een eiwitfamiliedatabase, [22] een RNA-familiedatabase, [23] een database van fylogenetische bomen voor dierlijke genen, [24] een database over de biologie en sequentie van het modelorganismeC. elegans en andere verwante nematoden. , een database voor de genomica voor parasitaire wormen (zowel nematoden als platyhelminthes).

Wetenschappelijk onderzoek aan het Sanger Institute is georganiseerd in vijf wetenschappelijke programma's, die elk een belangrijk onderzoeksgebied definiëren met een bepaalde biologische, ziekte- of analytische focus. De huidige programma's van het Sanger Institute zijn kanker, veroudering en somatische mutatie, cellulaire genetica, menselijke genetica, parasieten en microben en levensboom. Studies van alle opleidingen geven inzicht in de evolutie van de mens, pathogenen, cellen, de fenotypische en dus biologische gevolgen van genoomvariatie en de processen die mutaties veroorzaken.

Programma voor kanker, veroudering en somatische mutatie Bewerken

Levert leiderschap in data-aggregatie en informatica-innovatie, ontwikkelt high-throughput cellulaire modellen van kanker voor genoombrede functionele screening en medicijntesten, en onderzoekt de rol van somatische mutaties in klonale evolutie, veroudering en ontwikkeling. Dit programma omvat het kankergenoomproject.

Programma voor cellulaire genetica bewerken

Onderzoekt de functie van menselijke genen door de impact van genoomvariatie op celbiologie te bestuderen. Grootschalige systematische schermen worden gebruikt om de impact te ontdekken van natuurlijk voorkomende en gemanipuleerde genoommutaties in door de mens geïnduceerde pluripotente cellen (hIPSC's), hun gedifferentieerde derivaten en andere celtypen. Het is een van de oprichtersprogramma's die de oprichting en organisatie van het internationale Human Cell Atlas-initiatief aandrijven.

Programma voor menselijke genetica Bewerken

Het onderzoek van het instituut op het gebied van menselijke genetica richt zich op de karakterisering van menselijke genetische variatie in gezondheid en ziekte. Naast de bijdrage van het instituut aan het Human Genome Project, hebben onderzoekers van het Sanger Institute bijdragen geleverd op verschillende onderzoeksgebieden met betrekking tot ziekte, populatievergelijkende en evolutionaire genetica. In januari 2008 betekende de lancering van het 1000 Genomes Project, een samenwerking met wetenschappers over de hele wereld, een poging om de genomen van 1000 individuen te sequensen om de "meest gedetailleerde kaart van menselijke genetische variatie ter ondersteuning van ziektestudies" te creëren. [25] De gegevens van de proefprojecten zijn in juni 2010 vrij beschikbaar gesteld in openbare databases. [26] In 2010 kondigde het Sanger Institute zijn deelname aan het UK10K-project aan, [27] [28] [29] dat de volgorde van de genomen van 10.000 individuen om zeldzame genetische varianten en hun effecten op de menselijke gezondheid te identificeren. Het Sanger Institute maakt ook deel uit van het International Cancer Genome Consortium, een internationale inspanning om verschillende soorten kankertumoren te beschrijven. [30] Het maakt ook deel uit van de GENCODE- en ENCODE-onderzoeksprogramma's [31] om een ​​encyclopedie van DNA-elementen te creëren. [ citaat nodig ]

Het programma past genomica toe op studies op populatieschaal om de causale varianten en routes die betrokken zijn bij ziekten bij de mens en hun effecten op de celbiologie te identificeren. Het modelleert ook ontwikkelingsstoornissen om te onderzoeken welke fysieke aspecten omkeerbaar kunnen zijn.

Ziekteverwekkers en microben Programma bewerken

Onderzoekt de gemeenschappelijke onderliggende mechanismen van evolutie, infectie en resistentie tegen therapie om het begrip van bacteriën, virussen en parasieten te versterken, met een bijzondere interesse in malaria. Het onderzoekt ook de effecten van genoomvariatie op de biologie van interacties tussen gastheer en ziekteverwekker, in het bijzonder de reactie van de gastheer op infectie en de rol van micro-iotia bij gezondheid en ziekte. Alle genomen na sequencing worden beschikbaar gesteld in de webgebaseerde onsite-onderhouden database, GeneDB. [ citaat nodig ]

Tree of Life-programma bewerken

Het Tree of Life-programma is in 2019 opgericht om de diversiteit van complexe organismen in het VK te onderzoeken door middel van sequencing en cellulaire technologieën. Het vergelijkt en contrasteert ook de genoomsequenties van soorten om inzichten in evolutie en instandhouding te ontsluiten. Dit programma zal een leidende rol spelen in het Darwin Tree of Life Project, een initiatief in het hele VK om de genomen te sequensen van alle 66.000 complexe soorten (eukaryoten) op de Britse eilanden.

Samenwerkingen Bewerken

Veel van het onderzoek van het Sanger Institute wordt uitgevoerd in samenwerking met de bredere wetenschappelijke gemeenschap. Meer dan 90 procent van de onderzoekspapers van het instituut omvat samenwerkingen met andere organisaties. [32] Belangrijke samenwerkingen zijn onder meer:

Publieke betrokkenheid Bewerken

Het Sanger Institute heeft een programma voor publieksbetrokkenheid. Het programma heeft tot doel complex biomedisch onderzoek toegankelijk te maken voor een breed publiek, waaronder scholieren en hun leraren, en leden van de lokale gemeenschap.

Het programma Communicatie en publieksbetrokkenheid heeft tot doel "een geïnformeerde discussie aan te moedigen over kwesties die relevant zijn voor het onderzoek van het Sanger Institute" [37] en "een gemeenschap van onderzoekers te bevorderen die effectief met verschillende doelgroepen kan communiceren". [37] Het instituut organiseert bezoeken voor meer dan 1.500 studenten, docenten en gemeenschapsgroepen per jaar. Bezoekers kunnen wetenschappelijk personeel ontmoeten, het Instituut en zijn faciliteiten bezoeken en deelnemen aan ethische debatten en activiteiten. Het programma biedt ook professionele ontwikkelingssessies voor leraren van GCSE en post 16 wetenschap via het nationale netwerk van Science Learning Centres, en door bezoeken te organiseren voor groepen die geïnteresseerd zijn in het bijwerken van hun kennis in hedendaagse genetica. Videoconferenties in het Sanger Institute worden ook aangeboden voor Science Learning Centres, Science Centres en scholen.

Medewerkers van wetenschappelijk en publiek engagement werken ook samen aan en dragen bij aan nationale projecten zoals die van het VK InsideDNA [38] reizende tentoonstelling en de Wie ben ik? galerie in het Wetenschapsmuseum. [39] Ze nemen ook deel aan openbare evenementen zoals het Cambridge Science Festival.

Afgestudeerde opleiding Bewerken

Het instituut heeft twee PhD-opleidingen: een vierjarige opleiding voor afgestudeerden in de basiswetenschappen en een driejarige opleiding voor clinici. De vierjarige opleiding vereist dat studenten rond drie verschillende laboratoria roteren om hun wetenschappelijke horizon te verbreden voordat ze een promotieproject kiezen. Elke student moet ten minste één experimenteel en één op informatica gebaseerd rotatieproject kiezen. [40] Het Instituut huisvest ongeveer 50 pre-doctorale studenten, die allemaal zijn geregistreerd aan de Universiteit van Cambridge. [41]

Volgens Companies House zijn de vijf functionarissen van het moederbedrijf Genome Research Limited Henry Parkinson, Kay Elizabeth Davies, Rolf Dieter Heuer, James Cuthbert Smith, David Lindsay Willetts. [42] Volgens de Sanger-website is Henry Parkinson hoofd juridische zaken. [43]

Vanaf 2015 [update] heeft de Sanger ongeveer 900 mensen in dienst en wordt geleid door Michael Stratton. Opmerkelijke wetenschappelijk personeel, docenten en alumni staan ​​​​hieronder vermeld:

Academische faculteit Bewerken

Vanaf 2019 [update] leidt een faculteit van 32 wetenschappers hypothesegestuurd onderzoek, op zoek naar antwoorden op biomedische vragen. [44] Dit zijn onder andere Dominic Kwiatkowski, Nicole Soranzo, Michael Stratton, Sarah Teichmann en Matthew Hurles. Het instituut heeft ook een aantal Associate Faculty-leden, International Fellows en Honorary Faculty. Deze omvatten Adrian Bird, Ewan Birney, Chris Ponting, Fiona Powrie, Stephen O'Rahilly, Antonio Vidal-Puig en Wolf Reik, onder anderen.

Wetenschappelijke adviesraad Bewerken

De raad van bestuur van Sanger wordt geleid door de wetenschappelijke adviesraad [45] die bestaat uit professor David Altshuler, professor Anton Berns, professor David J. Lipman, professor Kevin Marsh en professor Sir Paul Nurse.

Alumni Bewerken

Eerdere docenten aan de Sanger zijn onder meer: ​​[46]

Beheer Bewerken

John E. Sulston was de oprichter en directeur van het Sanger Institute. Sulston speelde een belangrijke rol bij de keuze van de Hinxton-site voor het Instituut en bleef daar als directeur tot de aankondiging van de voltooiing van het ontwerp van het menselijk genoom in 2000. [49] Sulston studeerde in 1963 af aan de Universiteit van Cambridge en promoveerde op de chemische synthese van DNA in 1966. [50] Hij deelde in 2002 de Nobelprijs voor Fysiologie of Geneeskunde met Robert Horvitz en Sydney Brenner, [51] twee jaar na zijn aftreden als directeur van het instituut.

In 2000 verliet Allan Bradley zijn benoeming als professor aan het Baylor College of Medicine, in de VS, om de functie van directeur van het Sanger Institute op zich te nemen. Bradley wilde voortbouwen op de prestaties van het Sanger Institute in het Human Genome Project door "zich te concentreren op genfunctie, kankergenomica en de genomen van modelorganismen zoals de muis en de zebravis". [52] Bradley behaalde zijn BA, MA en PhD in Genetica aan de Universiteit van Cambridge. [53] [54] [55] [56]

In 2010 nam Bradley afscheid van zijn leidende rol om een ​​startend bedrijf te vormen, maar hij blijft aan de faculteit van het Instituut als emeritus directeur. Mike Stratton, leider van het Cancer Genome Project en het International Cancer Genome Consortium, werd in mei van dat jaar benoemd tot directeur van het Sanger Institute. [57]

Project menselijk genoom bewerken

Het Sanger Institute werd geopend in 1993, drie jaar na de start van het Human Genome Project, en leverde de grootste afzonderlijke bijdrage aan de gouden standaardsequentie van het menselijk genoom, gepubliceerd in 2004. [58] Het instituut hield zich bezig met samenwerkingen om 8 van de 23 menselijke chromosomenparen (1, 6, 9, 10, 13, 20, 22 en X) te sequensen. [59] Sinds de publicatie van het menselijk genoom heeft het onderzoek van het instituut zich verder ontwikkeld dan het sequencen van organismen naar verschillende biomedische onderzoeksgebieden, waaronder studies naar ziekten zoals kanker, malaria en diabetes.

In augustus 2018 werd gemeld dat er een onderzoek gaande was naar beschuldigingen van pesten van personeel en genderdiscriminatie tegen het senior management van het Wellcome Trust Sanger Institute, inclusief de directeur. [60] Het onderzoek, uitgevoerd door advocaat Thomas Kibling van Matrix Chambers, werd in oktober 2018 afgerond en heeft Stratton vrijgesproken van enig wangedrag, terwijl ook verbeterpunten in de werking van het Sanger Institute zijn opgesomd. [61] [62] De bevindingen en de onafhankelijkheid van het onderzoek werden betwist. [63]

In oktober 2019 werd gemeld dat het instituut een medisch hulpmiddel had vervaardigd met de bedoeling er geld mee te verdienen, ondanks het ontbreken van ethische of wettelijke goedkeuring om dit te doen en nadat het op de hoogte was gebracht door de Universiteit van Stellenbosch en interne klokkenluiders. [64]


Menselijke genomica: de genoomafmakers

Toegewijde wetenschappers werken er hard aan om de hiaten te dichten, de fouten te herstellen en uiteindelijk de sequentie van het menselijk genoom te voltooien. Elie Dolgin kijkt hoe dichtbij ze zijn.

Vanuit haar raamloze kantoor op de vijfde verdieping van het Amerikaanse National Institutes of Health in Bethesda, Maryland, heeft Deanna Church weinig afleiding van de baan die voor haar ligt. Op haar computer zitten 888 openstaande 'tickets', oftewel openstaande problemen met de sequentie van het menselijk genoom. Hoewel dat aantal fluctueert, is het een niet zo subtiele herinnering dat zij en haar team van het National Center for Biotechnology Information (NCBI) nog een lange weg te gaan hebben om de klus te klaren die bijna twee decennia geleden door het Human Genome Project is begonnen.

Dit is hetzelfde project waaraan een internationaal team van wetenschappers bijna 3 miljard dollar heeft uitgegeven om te voltooien. In 2000 kondigden de wetenschappers tijdens een ceremonie in het Witte Huis met veel tamtam aan dat ze klaar waren met de conceptsequentie van het menselijk genoom. Ze werden poëtisch over het openen van 'evolution's lab notebook' toen ze het concept het jaar daarop publiceerden 1 . En ze ontkurkten opnieuw champagneflessen in 2003, toen de reeks officieel als voltooid werd beschouwd 2 . Tegen die tijd rapporteerden mediakanalen de ontwikkelingen met een vleugje vermoeidheid. "Deze keer is het het echte werk, beloven wetenschappers," Nieuwe wetenschapper gemeld. Er ging nog een jaar voorbij voordat de definitieve analyses werden gepubliceerd 3 , en er gingen er nog twee voorbij voordat het artikel met details over het laatste, volledig gepolijste chromosoom in 2006 uitkwam (ref. 4).

Toch, drie jaar later, zit Church gebogen over haar computer, wegklikkend met haar muis, stilletjes de slepende problemen opruimend met de iconische reeks. Sommige van haar tickets, ingediend door haar medewerkers en gebruikers van over de hele wereld, zijn meldingen van ontbrekende stukjes. Anderen beschrijven stukken waarin iemand denkt dat de volgorde niet klopt. Weer andere zijn unieke en onverwachte uitdagingen, zoals complexe DNA-herschikkingen, die jaren in beslag kunnen nemen.

"Het is een frustratie", zegt Richard Gibbs, directeur van het Human Genome Sequencing Center aan het Baylor College of Medicine in Houston, Texas. "Het is een genoom van extreem hoge kwaliteit. Het is het beste dat er is, punt uit. Het probleem is dat een heel klein percentage onzekerheden zich nog steeds vertaalt in een aanzienlijk aantal problemen."

'Het werk is niet sexy. Maar het is belangrijk. Deanna-kerk, ”

Church en haar collega's werken aan een solide, nauwkeurige referentie, maar hun inspanningen hebben onthuld hoe glad dat concept kan zijn. De sequentie vertegenwoordigt bijvoorbeeld niet het genoom van een persoon. Het is een amalgaam van DNA van verschillende mensen, zowel mannen als vrouwen. Het werd op deze manier samengesteld om de anonimiteit te behouden voor degenen die het DNA hebben bijgedragen en om ervoor te zorgen dat de sequentie de hele mensheid vertegenwoordigde - "onze gedeelde erfenis", zoals toenmalig hoofd van het project, Francis Collins, zei.

Maar die gedeelde erfenis is moeilijk vast te leggen. De genomen van twee individuen lijken minder op elkaar dan velen aanvankelijk hadden aangenomen. In plaats van een lineair pad van 3 miljard basenparen te volgen met een letter die af en toe verandert, maken menselijke genomen een omweg naar honderden enorm verschillende stukken waarin, afhankelijk van het individu, miljoenen basenparen kunnen worden verwijderd, ingevoegd, herhaald of omgekeerd.

Een voltooid referentiegenoom zal - indien haalbaar - er daarom heel anders uitzien dan de eerste uitvoeringen van het project. Dat is waar Church en haar team van finishers om de hoek komen kijken. Ze streven ernaar om de verschillen weg te werken en een dynamischer platform te ontwikkelen dat veel van de overeenkomsten en uniciteit van de mensheid kan vastleggen. Sommigen zeggen dat het een verspilde moeite is nu individuele menselijke genomen kunnen worden gesequenced tegen een fractie van wat het tien jaar geleden kostte, maar de meesten zeggen dat de referentie van onschatbare waarde is als basis om de sequencing van toekomstige menselijke genomen te ondersteunen.

Het oplossen van de problemen in de reeks zal de kerk niet veel lofbetuigingen opleveren. Ze zal de president niet ontmoeten of kranten in spraakmakende tijdschriften plaatsen zoals degenen die het genoom eerder hebben "afgemaakt". En als ze eenmaal een kaartje heeft laten rusten, staat er altijd een ander te wachten. "Het is niet sexy", zegt ze. "Maar het is belangrijk."

Een coalitie van de verantwoordelijken

In april 2003 had de sequencing de technische definitie van voltooiing van het internationale project overtroffen - de sequentie bevatte minder dan 1 fout per 10.000 nucleotiden en besloeg 95% van de genbevattende delen van het genoom. Maar er waren nog steeds fouten - ongeveer 350 gaten in de reeks - en veel van de structurele variatie was niet opgenomen.

In 2004 kwamen Church en enkele tientallen onderzoekers bijeen om genomica en structurele variatie te bespreken in het Wellcome Trust Sanger Institute in Hinxton, VK. Eén klacht werd herhaaldelijk herhaald: er was geen gemakkelijke manier om het genoom te repareren of te updaten met nieuwe gegevens. In de jaren negentig, toen sequencing in volle gang was, konden onderzoekers contact opnemen met de specifieke chromosoomcuratoren van elk van de grote sequencingcentra die bij het project betrokken waren om eventuele sequencing-mislukkingen te melden. Maar in 2004 waren maar weinig van de betrokken centra actief bezig met het monitoren van hun stukjes van het genoom en was er weinig wetenschappelijke stimulans om oud werk opnieuw te bekijken. Dit leverde een probleem op."Iemand moet verantwoordelijk zijn voor het genoom, zodat verbeteringen kunnen worden aangebracht als er fouten worden gevonden", zegt Adam Felsenfeld, programmadirecteur bij het National Human Genome Research Institute (NHGRI) in Bethesda, Maryland.

Samen met Ewan Birney van het European Bioinformatics Institute (EBI) in Hinxton deed Church een beroep op de NHGRI en de Wellcome Trust voor financiering. Het duurde meer dan twee jaar aan vergaderingen en beraadslagingen, maar uiteindelijk stemde de NHGRI ermee in om tot US $ 1 miljoen aan bedrijfsfondsen te reserveren van een jaarlijkse grootschalige sequencing-award (meer dan $ 30 miljoen per jaar) aan de Washington University in St. Louis, Missouri. Sanger en de Wellcome Trust kwamen een vergelijkbaar bedrag overeen, en de EBI en NCBI behandelen de informatica als onderdeel van hun normale bedrijfsvoering. De samenwerking, bekend als het Genome Reference Consortium (GRC), is nu het epicentrum voor genoomverbetering.

Om de referentie te verbeteren, concentreert het GRC zich op drie hoofddoelen: het corrigeren van assemblagefouten om de resterende hiaten in het genoom op te vullen en het produceren van alternatieve sequenties voor regio's van het genoom met uitgebreide variabiliteit.

Onderzoekers hebben de eerste twee doelstellingen op hun agenda staan ​​sinds het Human Genome Project werd afgerond, en sindsdien hebben ze eraan gewerkt. Sommige regio's waren bijzonder moeilijk af te poetsen. Voor sommige repetitieve stukken hadden onderzoekers bijvoorbeeld moeite om meerdere kopieën in bacteriën te maken - een noodzakelijk onderdeel van het sequentieproces. Maar met nieuwere methoden kunnen ze deze stukjes van het genoom nu invullen. Eerder dit jaar gebruikte een team onder leiding van Chad Nusbaum, mededirecteur van het Genome Sequencing and Analysis-programma van het Broad Institute in Cambridge, Massachusetts, een sequentietechnologie van de volgende generatie waarvoor geen bacteriën nodig zijn om het DNA te versterken 5 . Het team van Nusbaum overhandigde de sequenties vervolgens aan de GRC, die ze in de referentieassemblage opnam.

Het derde doel weerspiegelt iets dat pas onlangs aan het licht is gekomen. Aanvankelijk gingen onderzoekers ervan uit dat genetische variatie tussen mensen grotendeels bestond uit verschillen in enkele DNA-letters. Nu begrijpen ze echter beter de omvang van structurele variaties - inclusief deleties, inserties, duplicaties en inversies. Hoewel sommige van deze varianten betrokken zijn bij erfelijke ziekten, zijn ze veel moeilijker bij te houden dan verschillen van één letter, omdat ze vaak niet gemakkelijk op de referentie kunnen worden afgestemd. Dus in plaats van het genoom weer te geven als een enkel pad van drie miljard letters, introduceert de GRC alternatieve paden om de diversiteit ervan weer te geven.

Eén zo'n gebied is het belangrijkste histocompatibiliteitscomplex (MHC) - een stuk van 4 miljoen basenparen van chromosoom 6 dat veel immuniteitsgerelateerde genen bevat en wordt erkend als een van de meest variabele delen van het menselijk genoom. De oorspronkelijke referentiesequentie was een mengelmoes van meerdere blokken DNA, haplotypes genaamd, afkomstig van verschillende donoren, dus de sequentie die daaruit voortkwam, bestond niet echt in een echt persoon. Om een ​​referentie met een duidelijkere oorsprong te creëren, heeft een team onder leiding van Stephan Beck van het University College London Cancer Institute een enkel MHC-haplotype gesequenced. Ze vergeleken het vervolgens met zeven andere veelvoorkomende Europese haplotypes en ontdekten meer dan 37.000 enkele DNA-letterverschillen en ongeveer 7.000 structurele variaties - een niveau van genetische diversiteit dat ongeveer een orde van grootte groter is dan het genomische gemiddelde 6 . De referentie van het Beck's-team is nu omgezet in de standaardsequentie van de GRC en de andere zeven haplotypes zijn opgenomen als alternatieve routes.

“Iemand moet verantwoordelijkheid nemen voor het genoom. Adam Felsenfeld, ”

Twee andere regio's hebben ook vervangende haplotypes. De ene zit op chromosoom 4 rond het gen dat codeert voor het UGT2B17-enzym, dat steroïde hormonen en veel medicijnen metaboliseert. De 'voltooide' referentie had twee haplotypes verkeerd geassembleerd, waardoor een valse kloof werd geïntroduceerd. Een gecorrigeerde vergadering ontdekte dat de 'kloof' eigenlijk een deletie was die alleen bij sommige mensen werd gevonden, geflankeerd door grote duplicaties. Die sectie is nu opgenomen als een alternatieve route in de GRC-referentie.

Het andere gebied, op chromosoom 17, omvat de KAART gen, en biedt een case study van de limieten van de oorspronkelijke referentiesequentie, die uit slechts één haplotype bestond. Een alternatief haplotype, een complexe inversie van het eerste die wordt aangetroffen bij 20% van de Europeanen, bleek in 2005 te correleren met grotere gezinsgroottes, wat suggereert dat dit tweede haplotype onder een of andere vorm van positieve selectie viel 7 . Maar in 2006, Evan Eichler 8 , een geneticus aan de Universiteit van Washington in Seattle, en twee andere groepen 9 , 10 toonde aan dat het omgekeerde gebied ook vatbaar was voor frequente spontane deleties die leidden tot mentale retardatie. Het omgekeerde haplotype leek zowel adaptief als de bron van slopende deleties te zijn. "Je hebt hier een yin voor de yang die wordt bepaald door de genomische structuur", zegt Eichler. "De vraag was: 'Wat is er aan de hand?'"

Om die vraag te beantwoorden, had Eichler de sequenties nodig. Hij werkte samen met Michael Zody, hoofdtechnoloog van het Genome Biology Program aan het Broad Institute, om de hele regio te resequensen en toonde aan dat de architectuur van het omgekeerde haplotype de sequentie predisponeerde om deleties te ondergaan die verband houden met mentale retardatie 11 . Tegen de tijd dat Eichler en Zody hun resultaten publiceerden, in 2008, was de GRC al in volle gang en maakte zich op om de volgende build van het genoom vrij te geven. De onderzoekers droegen hun sequenties over aan het consortium en beide haplotypes werden opgenomen in de referentiesequentie. "De GRC zorgde voor een centraal verrekenkantoor waar we doorheen konden", zegt Zody.

Gezien de klinische relevantie van deze en andere complexe regio's, is het verstrekken van meerdere referenties essentieel om de mutaties te detecteren die ten grondslag liggen aan veel ziekten, zegt Eichler. "Zodra we de alternatieve structuren hebben uitgewerkt, denk ik dat we ziekteassociaties kunnen maken die voorheen onmogelijk waren", zegt hij. Eichler schat dat ongeveer 5% van het genoom - overeenkomend met ongeveer 400 specifieke locaties - alternatieve sequenties nodig heeft om een ​​platform te bieden dat het spectrum van menselijke diversiteit adequaat vastlegt. Deze regio's bevatten meer dan 1.000 genen die een breed scala aan fysiologische processen beïnvloeden, waaronder immuunresponsen, ontgifting van geneesmiddelen en reproductievermogen, zegt hij.

Het eerste openbare aanbod van de GRC - een nauwkeurigere versie van het menselijk genoom - werd in maart 2009 online gelanceerd, werkte de drie delen van het genoom bij met de alternatieve samenstellingen, corrigeerde meer dan 150 uitlijningsproblemen en sloot 25 sequencing-hiaten. Maar dat laat nog steeds meer dan 300 hiaten. In september kwamen 20 van de kernleden van de GRC in Hinxton bijeen voor de tweejaarlijkse bijeenkomst van de groep om te bespreken welke volgende stappen moesten worden genomen. Terwijl laboratoriummedewerkers op hun toetsenbord aan het klakken waren, werkten bio-informatici aan een van de meest controversiële kwesties van het consortium: hoe het referentiegenoom te veranderen om alleen de 'gewone' genvarianten weer te geven. De negenkoppige wetenschappelijke adviesraad van het GRC, waaronder Eichler en Gibbs, heeft aanbevolen dat het genoom, waar mogelijk, de gemeenschappelijke versies van de DNA-sequentie bevat. Maar het heeft niet gedefinieerd wat 'gemeenschappelijk' betekent. Moet het de variant met de hoogste frequentie zijn of iets dat door een redelijk deel van de bevolking wordt gedeeld? Moet het worden berekend over de meer dan zes miljard inwoners van de wereld of alleen in een bepaalde etnische of geografische groep? Resultaten die voortkomen uit het 1000 Genomes Project, een grote internationale sequencing-inspanning om menselijke genetische variatie in ongeveer 2.000 mensen uit vier continenten te catalogiseren, zouden hun beslissingen moeten informeren.

“Ik denk dat we ziekteassociaties zullen kunnen maken die voorheen onmogelijk waren. Evan Eichler, ”

Sommige GRC-leden zijn het niet eens met het aanbrengen van dergelijke fundamentele wijzigingen in de referentiereeks. "Ik denk niet dat we door het hele genoom heen moeten gaan met enkele basen", zegt Paul Flicek, die de groep voor gewervelde genomica bij de EBI leidt. "Informatisch maakt het gewoon niet uit. Zolang het werkt, vind ik het oké."

Anderen buiten het GRC vragen zich af of het hele project gerechtvaardigd is. Waarom zou je sleutelen aan een tien jaar oude referentie, vraagt ​​Lincoln Stein, een bio-informaticus aan het Ontario Institute for Cancer Research in Toronto, Canada. Hij noemt de inspanning "meer een abstracte oefening dan een die een praktische impact zal hebben". Church, van haar kant, wuift kritiek weg van degenen die zich bezighouden met grootschalige genomica. Als persoon met oog voor detail weet ze dat de kleine dingen tellen. Individuele onderzoekers houden van hun huisdierengenen. Dat is een van de redenen waarom haar wachtrij met tickets altijd vol is. En naarmate genomics steeds meer op de voorgrond van gepersonaliseerde geneeskunde komt te staan, kunnen veel regio's van klinisch nut door de kieren glippen. Voor onderzoekers die geïnteresseerd zijn in een bepaalde ziekterelevante locus "maakt het niet uit dat het genoom voor 99% compleet is", zegt ze. "Als ze [werken met] een regio die onvolledig en verkeerd is, zijn ze genaaid."

En zo gaat de GRC verder met zijn stille zoektocht, waarbij hij T's kruist en soms verandert in As, C's of G's. Totdat een referentie niet langer nodig is om het DNA dat afkomstig is van de huidige sequencing-technologieën samen te stellen, zal het het evoluerende begrip van de menselijke variabiliteit in het referentiegenoom blijven documenteren. De GRC heeft ook de muissequentie op zich genomen en zal in 2010 de verantwoordelijkheid voor de zebravissequentie op zich nemen. Hoewel het misschien geen krantenkoppen haalt, erkennen de meeste in de onderzoeksgemeenschap de waarde ervan. "De GRC heeft precies het juiste idee", zegt Jonathan Sebat, een geneticus die structurele variatie bestudeert aan het Cold Spring Harbor Laboratory in New York. "Het is een no-brainer dat iemand nodig zou zijn om de rommel op te ruimen."


Eenzaamheid is een molecuul

Veranderingen in het immuunsysteem kunnen verklaren waarom sociale factoren zoals eenzaamheid verband houden met een verhoogd risico op hartaandoeningen, virale infecties en kanker.

Het is al bekend dat de sociale omgeving van een persoon zijn gezondheid kan beïnvloeden, met degenen die sociaal geïsoleerd zijn - dat wil zeggen, eenzame mensen die lijden aan een hogere mortaliteit dan mensen die dat niet zijn.

Nu, in de eerste studie in zijn soort, gepubliceerd in het huidige nummer van het tijdschrift Genome Biology, hebben UCLA-onderzoekers een duidelijk patroon van genexpressie in immuuncellen geïdentificeerd van mensen die chronisch veel eenzaamheid ervaren. De bevindingen suggereren dat gevoelens van sociaal isolement verband houden met veranderingen in de activiteit van genen die ontstekingen veroorzaken, de eerste reactie van het immuunsysteem. De studie biedt een moleculair raamwerk om te begrijpen waarom sociale factoren verband houden met een verhoogd risico op hartaandoeningen, virale infecties en kanker.

Nadat eerder was vastgesteld dat eenzame mensen een hogere mortaliteit hebben dan mensen die dat niet zijn, proberen onderzoekers nu vast te stellen of dat risico het gevolg is van verminderde sociale hulpbronnen, zoals fysieke of economische hulp, of van de biologische impact van sociaal isolement op de functie van het menselijk lichaam.

"Wat deze studie laat zien, is dat de biologische impact van sociaal isolement tot in enkele van onze meest basale interne processen reikt, de activiteit van onze genen." zei Steve Cole, een universitair hoofddocent geneeskunde in de afdeling Hematologie-Oncologie aan de David Geffen School of Medicine, en een lid van het UCLA Cousins ​​Center for Psychoneuroimmunology.

"We ontdekten dat veranderingen in de genexpressie van immuuncellen specifiek verband hielden met de subjectieve ervaring van sociale afstand", zegt Cole, die ook lid is van het Jonsson Comprehensive Cancer Center. "De verschillen die we waarnamen waren onafhankelijk van andere bekende risicofactoren, zoals gezondheidsstatus, leeftijd, gewicht en medicatiegebruik. De veranderingen waren zelfs onafhankelijk van de objectieve grootte van iemands sociale netwerk."

Cole en collega's van de UCLA en de Universiteit van Chicago gebruikten DNA-microarrays om de activiteit van alle bekende menselijke genen in witte bloedcellen van 14 personen in de Chicago Health, Aging, and Social Relations Study te onderzoeken. Zes deelnemers scoorden in de top 15 procent van de UCLA-eenzaamheidsschaal, een veelgebruikte maatstaf voor eenzaamheid die in de jaren zeventig werd ontwikkeld, de anderen scoorden in de onderste 15 procent. De onderzoekers ontdekten dat 209 gentranscripten (de eerste stap in het maken van een eiwit) differentieel tot expressie werden gebracht tussen de twee groepen, waarbij 78 tot overexpressie werden gebracht en 131 tot onderexpressie. "De genexpressie van leukocyten (witte bloedcellen) lijkt te worden hervormd bij chronisch eenzame individuen," zei. Cole.

Genen die in eenzame individuen tot overexpressie worden gebracht, omvatten veel genen die betrokken zijn bij activering en ontsteking van het immuunsysteem. Maar interessant genoeg werden verschillende andere belangrijke genensets onderexpressie gebracht, waaronder die welke betrokken zijn bij antivirale reacties en antilichaamproductie. "Deze bevindingen bieden moleculaire doelen voor onze inspanningen om de nadelige gezondheidseffecten van sociaal isolement te blokkeren," zei Cole.

"We ontdekten dat wat telt op het niveau van genexpressie niet is hoeveel mensen je kent, maar met hoeveel je je in de loop van de tijd heel dichtbij voelt." In de toekomst, zei hij, kan de transcriptionele vingerafdruk die ze hebben geïdentificeerd nuttig worden als een 'biomarker' om interventies te volgen die zijn ontworpen om de impact van eenzaamheid op de gezondheid te verminderen.

Deze studie werd ondersteund door de National Institutes of Health, het Mind, Body, Brain and Health Initiative van de John D en Catherine T MacArthur Foundation, het Norman Cousins ​​Center aan de UCLA, de John Templeton Foundation en de James B Pendelton Charitable Trust. Andere auteurs waren Louise C Hawkley, Jesusa M Arevalo, Caroline Y Sung, Robert M Rose en John T Cacioppo.

Referentie: Steve W. Cole, Louise C Hawkley, Jesusa M Arevalo, Caroline Y Sung, Robert M Rose en John T Cacioppo "Sociale regulering van genexpressie bij mensen: glucocorticoïde resistentie in het leukocyttranscriptoom" Genoombiologie (in druk)

Verhaalbron:

Materialen geleverd door Universiteit van Californië - Los Angeles. Opmerking: inhoud kan worden bewerkt voor stijl en lengte.


Menselijk genoom bevat 'vreemde' genen die niet van onze voorouders zijn

Veel dieren, waaronder mensen, hebben in de oudheid essentiële 'vreemde' genen verkregen van micro-organismen die in hun omgeving samenwoonden, blijkt uit onderzoek dat is gepubliceerd in het open access-tijdschrift Genome Biology. De studie daagt de conventionele opvatting uit dat de evolutie van dieren uitsluitend afhankelijk is van genen die zijn doorgegeven via voorouderlijke lijnen en suggereert dat het proces, althans in sommige geslachten, nog steeds aan de gang is.

Misschien moeten we opnieuw evalueren hoe we over evolutie denken

Alastair Crisp

De overdracht van genen tussen organismen die in dezelfde omgeving leven, staat bekend als horizontale genoverdracht. Het is bekend bij eencellige organismen en wordt beschouwd als een belangrijk proces dat verklaart hoe snel bacteriën resistentie ontwikkelen tegen bijvoorbeeld antibiotica.

Er wordt ook gedacht dat horizontale genoverdracht een belangrijke rol speelt in de evolutie van sommige dieren, waaronder nematodenwormen, die genen hebben verkregen van micro-organismen en planten, en sommige kevers die bacteriële genen hebben gekregen om enzymen te produceren voor het verteren van koffiebessen. Het idee dat horizontale genoverdracht plaatsvindt bij complexere dieren, zoals mensen, is echter veel besproken en betwist.

Hoofdauteur Alastair Crisp van de afdeling Chemische Technologie en Biotechnologie van de Universiteit van Cambridge zei: "Dit is de eerste studie die laat zien hoe wijdverbreid horizontale genoverdracht plaatsvindt bij dieren, inclusief mensen, en aanleiding geeft tot tientallen of honderden actieve 'vreemde' genen. Verrassend genoeg lijkt het verre van zeldzaam te zijn dat dit heeft bijgedragen aan de evolutie van vele, misschien wel alle dieren en dat het proces aan de gang is. Misschien moeten we opnieuw evalueren hoe we over evolutie denken."

De onderzoekers bestudeerden het genoom van 12 soorten fruitvliegen, vier soorten nematodenwormen en tien soorten primaten, waaronder de mens. Ze berekenden hoe goed elk van hun genen overeenkomt met vergelijkbare genen in andere soorten om te schatten hoe waarschijnlijk het was dat ze van vreemde oorsprong waren. Door te vergelijken met andere soortengroepen, konden ze inschatten hoe lang geleden de genen waarschijnlijk waren verworven.

Bij mensen bevestigden ze 17 eerder gerapporteerde genen verkregen door horizontale genoverdracht en identificeerden ze 128 extra vreemde genen in het menselijk genoom die niet eerder zijn gerapporteerd. Een aantal genen, waaronder het ABO-gen, dat de bloedgroep van een individu bepaalt, werd ook bevestigd als zijnde verworven door gewervelde dieren via horizontale genoverdracht. De meeste genen waren gerelateerd aan enzymen die betrokken zijn bij het metabolisme.

Bij mensen waren sommige genen betrokken bij het lipidenmetabolisme, waaronder de afbraak van vetzuren en de vorming van glycolipiden. Anderen waren betrokken bij immuunreacties, waaronder de ontstekingsreactie, immuuncelsignalering en antimicrobiële reacties, terwijl andere gencategorieën het aminozuurmetabolisme, eiwitmodificatie en antioxidantactiviteiten omvatten.

Het team identificeerde de waarschijnlijke klasse van organismen waaruit de overgedragen genen kwamen. Bacteriën en protisten, een andere klasse van micro-organismen, waren de meest voorkomende donoren in alle bestudeerde soorten. Ze identificeerden ook horizontale genoverdracht van virussen, die verantwoordelijk was voor tot 50 meer vreemde genen bij primaten.

Sommige genen werden geïdentificeerd als afkomstig van schimmels. Dit verklaart waarom sommige eerdere onderzoeken, die zich alleen richtten op bacteriën als de bron van horizontale genoverdracht, aanvankelijk het idee verwierpen dat deze genen van ‘vreemde’ oorsprong waren.

De meeste horizontale genoverdracht bij primaten bleek oud te zijn, ergens tussen de gemeenschappelijke voorouder van Chordata en de gemeenschappelijke voorouder van de primaten.

De auteurs zeggen dat hun analyse waarschijnlijk de ware omvang van horizontale genoverdracht bij dieren onderschat en dat directe overdracht tussen complexe meercellige organismen ook aannemelijk is en al bekend is in sommige gastheer-parasiet relaties.

De studie heeft ook potentiële effecten op genoomsequencing in het algemeen. Genoomprojecten verwijderen vaak bacteriële sequenties uit resultaten in de veronderstelling dat het besmetting is.

"Het is belangrijk om te screenen op contaminatie wanneer we genoomsequencing uitvoeren, maar onze studie toont aan dat we de mogelijkheid niet mogen negeren dat bacteriële sequenties een echt onderdeel zijn van het genoom van een dier dat voortkomt uit horizontale genoverdracht", voegt Dr. Chiara Boschetti van de afdeling Chemische Technologie en Biotechnologie.

Het onderzoek werd ondersteund door de European Research Council.

Aangepast van een persbericht van BioMed Central.

De tekst in dit werk is gelicentieerd onder een Creative Commons-licentie. Als u deze inhoud op uw site gebruikt, link dan terug naar deze pagina.Zie voor afbeeldingsrechten de credits die bij elke afzonderlijke afbeelding horen.


Marathon man

“WAAR is het rundvlees?” is altijd een redelijke vraag om te stellen. Voor het menselijk genoom kan het enigszins worden geherformuleerd als "waar zijn de medicijnen?" Het is een vraag die genomicisten niet echt doet kronkelen, maar het zet ze in de verdediging.

Als je nu de meer optimistische uitspraken had geloofd die werden gedaan op het moment dat het menselijk-genoomproject tot wasdom kwam, zouden de pijplijnen van farmaceutische bedrijven barsten van de veelbelovende behandelingen voor alles, van de ziekte van Alzheimer tot het Zollinger-Ellison-syndroom, omdat de genen die bij deze ziekten betrokken waren, werden geïdentificeerd en er werden medicijnmoleculen ontdekt die storingen van die genen konden corrigeren. In feite zijn de pijpleidingen leeg. Bedrijfsanalisten lijken onderzoek vaak te beschouwen als een aanslag op de balans, in plaats van een troef, en farmaceutische bedrijven lijken zichzelf opnieuw uit te vinden als marketingfirma's voor gevestigde producten. De verklaring is een giftige mix van wetenschap en economie, maar het resultaat is een industrie die rijp is voor disruptie.

Tel je kippen niet

In 1990, toen het menselijk-genoomproject begon, dacht iedereen dat ze wisten wat een gen was. Het was een stuk DNA dat kon worden getranscribeerd door een enzym genaamd polymerase in een chemisch vergelijkbaar molecuul dat bekend staat als RNA. Het RNA fungeerde als een boodschapper die zelf werd vertaald in eiwitmoleculen in subcellulaire fabrieken die ribosomen worden genoemd. De vertaalcode was een reeks van drieletterige "woorden", codons genaamd, die elk stonden voor een van de 20 aminozuurmoleculen die de componenten van eiwitten vormen. De codons zijn geschreven in een vierletterig alfabet, A, C, G, T, dat de namen afkort van de chemicaliën waaruit DNA is gemaakt.

Het was allemaal heel netjes. Nobelprijzen werden in overvloed uitgereikt en, afgezien van enkele gespecialiseerde genen waarvan het RNA direct betrokken was bij het eiwitproductieproces, werd begrepen dat het "centrale dogma" van de biologie (zoals beschreven door Francis Crick, mede-ontdekker van de structuur van DNA) was dat één gen gelijk is aan één RNA-boodschappermolecuul gelijk aan één eiwit. Eiwitten zijn de werkpaarden van cellen en werken als enzymen, ionenkanalen, signaalmoleculen en structurele elementen. En sommige eiwitten fungeren als transcriptiefactoren en reguleren de output van de genen zelf. Het systeem was volkomen logisch. Er waren een paar eigenaardigheden. Het meest opvallende was dat de beste schatting voor de hoeveelheid DNA die voor eiwitten codeerde slechts 3% was van al het DNA in het genoom. In de haast van zelffelicitatie schonk echter niemand teveel aandacht aan dat feit. Het niet-gen-DNA werd afwijzend bestempeld als "junk".

Iemand had er echter rekening mee moeten houden. Een aanzienlijke hoeveelheid van de rommel, zo blijkt, wordt getranscribeerd in RNA, hoewel het geen eiwitten maakt. In plaats daarvan is het RNA zelf bezig met het doen van taken waarvan ooit werd gedacht dat het het voorrecht van eiwitten was: het reguleren van de transcriptie van andere genen, het beschermen van cellen tegen virale aanvallen en zelfs het onder controle houden van stukjes DNA die echt rommel zijn (of, beter gezegd, zijn parasitair op het hele genomische apparaat).

Niemand weet hoeveel "RNA-only" genen er zijn, maar het kunnen er meer dan 100.000 zijn. Tien jaar geleden waren er nog maar een handjevol bekend. Daarentegen is de huidige schatting van het aantal eiwitcoderende genen in het menselijk genoom 23.000. De RNA-only genen zijn bovendien medisch significant. Ze duiken steeds weer op, bijvoorbeeld bij kankers.

De tweede laag van complexiteit - niet geheel onverwacht, maar zeker ondergewaardeerd - wordt epigenetica genoemd. Dit is het proces waarbij DNA chemisch wordt veranderd door de toevoeging van een methylgroep (een koolstofatoom en drie waterstofatomen) aan de genetische letter C. Epigenese is nog een andere manier om transcriptie te reguleren (de methylering stopt dit). Het is echter permanenter dan de aan/uit-schakeling die wordt geboden door transcriptiefactoren en alleen RNA-genen. Het is zelfs zo permanent dat het soms van generatie op generatie kan worden doorgegeven, wat leidt tot veel opgewonden gepraat over de overerving van verworven eigenschappen - die normaal gesproken als een darwinistische nee-nee worden beschouwd.

Zulk gepraat is voorbarig. Permanenter is niet hetzelfde als onuitwisbaar, en epigenetische veranderingen worden niet oneindig doorgegeven. Desalniettemin kunnen ze helpen bij het verklaren van ziektepatronen, zoals diabetes met late aanvang. Dit, zo vermoeden sommige onderzoekers, kan worden aangemoedigd door kinderen die epigenetische patronen erven die passen bij de voeding van hun ouders, maar niet passen bij de verschillende, meer calorische voeding die kinderen genieten dankzij de overvloed van het moderne leven.

De derde laag van complexiteit is er een die nu pas wordt onderzocht. Zowel biologen als leken beschouwen het genoom als lineair. DNA is inderdaad een molecuul met een lange keten. Het is echter zo lang dat als de 3 miljard basenparen aan elkaar zouden worden gekoppeld en er recht uitgetrokken, het resultaat een meter in omvang zou zijn. In werkelijkheid wordt DNA in de celkern gedraaid en opgevouwen, met als resultaat dat stukjes van het molecuul die op een kaart ver uit elkaar lijken, zich in de kern eigenlijk naast elkaar bevinden.

Hoeveel dit ertoe doet, is bijna volledig onduidelijk. Wat wel bekend is, is dat er binnen een kern vaak actieve zones van DNA-transcriptie zijn die veel groter lijken te zijn dan de breedte van een DNA-streng en de bijbehorende eiwitten. Dit suggereert dat genen die schijnbaar ver van elkaar verwijderd zijn, in zekere zin samenwerken.

Al deze biologische complexiteit zou op zichzelf al erg genoeg zijn voor medicijnfabrikanten die een rustig leven zoeken. Het andere probleem was echter een nogal monumentale naïviteit over het gemak van het koppelen van nieuw ontdekte genen aan ziekten en ziekteprocessen. Dit is eigenlijk duivels moeilijk gebleken.

Verlicht onze duisternis

De voorkeursbenadering was de genoombrede associatiestudie, of GWAS. Honderden daarvan zijn de afgelopen vijf jaar uitgevoerd. Het idee klinkt logisch: verzamel monsters van mensen met en zonder bepaalde ziekten en zoek naar verbanden tussen die ziekten en bepaalde genetische mutaties, in de vorm van SNP's. De praktijk is echter niet echt met de goederen op de proppen gekomen.

De gedachte achter GWAS was dat het multigene ziekten zou blootleggen. Dit zijn omstandigheden die in families lijken te voorkomen, maar die niet gehoorzamen aan de duidelijke erfrechtwetten die in de 19e eeuw door Gregor Mendel zijn vastgelegd. De ziekten die zich wel op een Mendeliaanse manier gedragen, bijvoorbeeld hemofilie en sikkelcelanemie, zijn nauw verbonden met het mutatiefalen van individuele genen (respectievelijk een bloedstollingsfactor en een van de genen voor hemoglobine voor deze twee ziekten). ). De neiging van mensen in sommige families om te lijden aan hartaandoeningen, beroertes, late diabetes, de ziekte van Alzheimer, enzovoort, is daarentegen minder duidelijk. Uiteraard spelen omgevingsfactoren een rol. Maar mutaties zijn dat ook - alleen geen enkelvoudige, grootschalige mutaties zoals die welke hemofilie en sikkelcelanemie veroorzaken. In plaats daarvan suggereert het overervingspatroon dat veel mutaties met een klein individueel effect samenkomen om eerder een risico dan een zekerheid te produceren.

GWAS is geen totale mislukking geweest. Het heeft veel mutaties met een klein effect onthuld. Gemiddeld vormen deze echter slechts 10% van de totale erfelijkheidsgraad van een bepaalde ziekte. Mendeliaanse effecten voegen ongeveer nog eens 1% toe. De rest, in een zin die genetici hebben geleend van natuurkundigen, wordt "donkere materie" genoemd. Deze mutaties lijken enorm belangrijk, maar noch Mendeliaanse noch GWAS-technieken kunnen ze detecteren. Mendeliaanse mutaties worden opgemerkt omdat ze zeldzaam en krachtig zijn. GWAS-mutaties worden gezien omdat ze, hoewel nietig, veel voorkomen. De donkere materie ligt in het midden: te zeldzaam voor GWAS maar niet krachtig genoeg om een ​​duidelijk Mendeliaans signaal achter te laten. Grotere GWAS, met meer statistische kracht, kan een beetje helpen, maar er zijn duidelijk nieuwe methoden nodig. Een daarvan zal zijn om whole-genome sequencing breder in te zetten, nu het zoveel goedkoper wordt. En hier loopt de studie van een bepaald soort ziekte, kanker, voorop.

Vergelijk en contrast

Kanker loopt om twee redenen voorop in de genomische geneeskunde. Een daarvan is dat oncologen en hun patiënten (en ook de regelgevers van de medische praktijk) vaak bereid zijn risico's te nemen die onaanvaardbaar zouden zijn als het alternatief geen vreselijke dood zou zijn. De andere is dat kanker nu ondubbelzinnig bekend staat als een genetische ziekte. Zijn omgevingscorrelaten (bijvoorbeeld roken) werken niet door cellen rechtstreeks te vergiftigen, maar door mutaties in het DNA van die cellen te bevorderen. Dergelijke somatische mutaties, zoals die in lichaamscellen bekend zijn, kunnen chaos veroorzaken in de organen van een individu, maar worden niet doorgegeven aan zijn of haar nakomelingen.

In het geval van kanker veroorzaakt een opeenhoping van somatische mutaties een afbraak van de regulerende mechanismen die een cel verhinderen om zich ongecontroleerd te vermenigvuldigen. Met de rem eraf gaat de cyclus van deling, groei en verdere deling onverminderd door totdat het lichaam niet langer zowel gezond weefsel als tumor kan ondersteunen.

Een les die genomics oncologie al vroeg heeft geleerd, is dat kankers die er onder de microscoop hetzelfde uitzien, totaal verschillende genetische oorzaken kunnen hebben en dus verschillende behandelingen vereisen. Die algemene observatie moet binnenkort in detail worden versterkt door een project van het International Cancer Genome Consortium (ICGC), een samenwerking van onderzoekers in 11 landen. Het plan is om te profiteren van de dalende kosten van sequencing om volledige DNA-sequenties te verzamelen van 500 mensen die lijden aan elk van de 50 soorten kanker. Niet alleen zal het kankerweefsel worden bemonsterd, maar ook gezond weefsel van elke patiënt.

Het vergelijken van het gezonde en het kankerweefsel in elk individu zal de somatische mutaties onthullen die dat individu heeft ondergaan. Door kankerweefsel van verschillende individuen te vergelijken, zal blijken welke mutaties belangrijk zijn. Dit is nodig omdat bij kankerpatiënten de genen die het proeflezen van nieuwe DNA-strengen aansturen vaak beschadigd raken, waardoor mutaties zich veel sneller ophopen. Dat betekent dat cruciale mutaties vaker voorkomen, maar ook dat er bij een bepaalde kanker veel mutatie "ruis" is.

Hierdoor is het tot nu toe moeilijker te achterhalen welke mutaties belangrijk zijn en welke slechts incidenteel. Het resultaat van de ICGC-studie zou een bijna volledig begrip van kanker op genetisch niveau moeten zijn. Dat zal de diagnose en behandeling helpen (artsen in staat stellen om de eerste keer de juiste medicijnen te kiezen, in plaats van vallen en opstaan) en, met een beetje geluk, de ontwikkeling van nieuwe behandelingen bevorderen.

Maar het identificeren van de onbetrouwbare genen is slechts de eerste stap naar dergelijke behandelingen. Niet alle genproducten zijn, in de argot, "drugable". En hier komt de economie om de hoek kijken.

Todd Golub van het Broad Institute in Cambridge, Massachusetts, denkt dat farmaceutische bedrijven nogal lui zijn geworden in het najagen van aanwijzingen. Veel oncogenen, zoals bekend zijn waarvan de breuk kanker veroorzaakt, coderen bijvoorbeeld voor eiwitten die kinasen worden genoemd. Dit zijn enzymen die betrokken zijn bij intracellulaire signaalroutes. Een meevaller enkele jaren geleden onthulde een systematische manier om kinasen aan te vallen met kleine moleculen die hun activering blokkeren. Onderzoekers met vermeende anti-kinasemedicijnen worden dus verwelkomd door durfkapitaalbedrijven. De kans op succes wordt begrepen en de time-to-market is acceptabel. Dat staat in schril contrast met bijvoorbeeld medicijnen die transcriptiefactoren kunnen controleren. Een gefaald transcriptiefactor-gen is een even vaak voorkomende oorzaak van kanker als een gefaald kinase-gen. Transcriptiefactoren worden echter niet als medicamenteus beschouwd. Er is nog geen systematische manier om ermee om te gaan ontdekt.

Dat is niet de schuld van de durfkapitalisten. Is het de schuld van de farmaceutische bedrijven? Ze zouden kunnen beweren dat ze zich niet bezighouden met fundamenteel onderzoek. Aan de andere kant zou een doorbraak op dit gebied een geheel nieuwe bedrijfstak creëren. Als die doorbraak echter een conceptuele doorbraak zou zijn die niet door octrooi beschermd zou kunnen worden, in plaats van, laten we zeggen, een individueel molecuul dat wel geoctrooieerd zou kunnen worden, dan zouden andere bedrijven kunnen meeliften op het dure onderzoek van de ontdekker.

Eerlijke aandelen

Dr. Golub heeft een suggestie om de impasse te doorbreken. Onafhankelijke laboratoria zoals de Broad zouden kunnen fungeren als eerlijke makelaars voor algemeen onderzoek dat wordt betaald door een kliek van alle grote farmaceutische bedrijven. Als ze gelijk zouden betalen, zouden ze allemaal evenveel profiteren. Aangezien dit fundamenteel onderzoek is, openlijk gepubliceerd, zou een dergelijke samenwerking waarschijnlijk worden toegestaan ​​door de antitrustwetten. Iets soortgelijks werd geprobeerd aan het begin van SNP-onderzoeken (hoewel die weliswaar nog niet tot veel hebben geleid op het gebied van geneeskunde). Op dit moment lijken de farmaceutische bedrijven niet geïnteresseerd. Misschien verandert dat als hun pijpleidingen leeg raken.

Ondanks dergelijke obstakels heeft genomics al geleid tot enkele successen in de behandeling van kanker. De verbazingwekkende mogelijkheden zijn te zien op de twee foto's op deze pagina. Ze zijn van dezelfde persoon voor en na behandeling met een molecuul met de codenaam PLX4032. De schaduwen zijn tumoren van secundair melanoom, een van de meest agressieve kankers die bekend zijn. PLX4032 heeft ze bijna volledig gewist. Het is specifiek ontworpen om te interageren met het eiwit dat wordt geproduceerd door een bepaalde gemuteerde versie van een gen genaamd B-RAF. Deze mutatie, V600E genaamd, blijkt betrokken te zijn bij 60% van de gevallen van maligne melanoom en, minder vaak, bij andere vormen van kanker. PLX4032 remt de activiteit van het gemuteerde eiwit en zorgt ervoor dat cellen die het bevatten afsterven.

In dit geval heeft het systeem gewerkt zoals het hoort. Het eiwit gecodeerd door B-RAF is een kinase (en daarom bekend bij durfkapitalisten). De initiële ontwikkeling werd gedaan door een klein biotechbedrijf genaamd Plexxikon, mede opgericht door Joseph Schlessinger van Yale University, een van de eerste onderzoekers op B-RAF. Het molecuul is nu opgepikt door een groot farmaceutisch bedrijf, Roche, dat betaalt voor fase III-onderzoeken, de laatste fase voordat een medicijn ter goedkeuring aan de autoriteiten wordt aangeboden. Als alles goed gaat, zal PLX4032, ongetwijfeld met een vriendelijkere naam, binnenkort beschikbaar zijn voor mensen die lijden aan melanoom, en zal het ook onderzoeken ondergaan bij andere soorten tumoren waarbij V600E betrokken is

Er zit een steek in de staart. Op dit moment duren de beschermende effecten van PLX4032 slechts zes maanden of zo. Vermoedelijk gaan verdere mutaties voorbij aan de V600E - precies het soort vraag dat het ICGC-project moet beantwoorden. Zodra die mutaties zijn geïdentificeerd, is de hoop dat er ook medicijnen tegen kunnen worden ontwikkeld. Als dat mogelijk blijkt, kunnen alle paden die tot kanker leiden, worden geblokkeerd. Dat zou in feite een remedie zijn.

Als een demonstratie van wat genomics kan doen, is PLX4032 indrukwekkend. De vraag is, kan dit soort dingen worden gedaan met andere soorten ziekten? Een van de collega's van Dr. Schlessinger bij Yale, Richard Lifton, denkt van wel. Hij wijst op een aantal recent ontdekte genen die nu onderwerp zijn van onderzoek door farmaceutische bedrijven. PCSK9, dat codeert voor een enzym dat betrokken is bij het cholesterolmetabolisme, is een doelwit voor de preventie van hartaandoeningen. Mensen met gemuteerde versies van ROMK, het gen voor een type kalium-ionkanaal, hebben een abnormaal lage bloeddruk, dus er wordt gezocht naar een medicijn dat de niet-gemuteerde versie van het kanaal aanpast, om de druk van mensen met hypertensie te verlagen. Degenen met gemuteerde versies van SCN9A, die codeert voor een bepaald natriumionkanaal, zijn ongevoelig voor pijn. Als je hieraan sleutelt, kan dit een superieure pijnstiller opleveren. En BACE, het gen voor een enzym dat bèta-secretase wordt genoemd, is betrokken bij de ziekte van Alzheimer. Het remmen van zijn actie kan de voortgang van die aandoening vertragen.

Een beetje kennis

Dit handjevol veelbelovende kandidaten toont echter de echte klachten van de farmaceutische bedrijven over genomics. Het is één ding om een ​​gen in het genoom te vinden, het is heel wat anders om erachter te komen wat het doet en nog iets om te begrijpen of die kennis enige medische waarde heeft. Totdat deze punten zijn aangepakt, kan de machine voor het maken van medicijnen die genomics ooit beloofde te worden, niet worden gebouwd.

Groter denken is nodig. Een gedurfde denker is George Church van de Harvard Medical School. Het Personal Genome Project (PGP) van Dr. Church stelt voor om monsters en medische gegevens van 100.000 mensen te verzamelen en de nieuw opkomende massa-sequencing-technieken te gebruiken om de volledige genomen van elk van hen vast te leggen. In zekere zin gaat de PGP de concurrentie aan met een aantal commerciële operaties (zie artikel). De twee verschillen zijn dat de toegang gratis is en dat alle informatie openbaar beschikbaar zal zijn.

Die open toegang is een gedurfd idee - en PGP wordt nog gedurfder door het feit dat dr. Church nieuwe technieken hoopt te gebruiken om enkele monstercellen om te zetten in stamcellen, waaruit alle weefseltypen van het lichaam kunnen worden gekweekt. Dit zal de onderzoekers van het project in staat stellen om weefsel voor weefsel genetisch onderzoek te doen.

De Biobank van het Verenigd Koninkrijk is nog ambitieuzer. Het is een door de overheid gerund project dat tot doel heeft weefselmonsters en medische gegevens te verzamelen van 500.000 mensen in Groot-Brittannië. Dat zal een analyse mogelijk maken van langetermijncorrelaties tussen genen (evenals levensstijl) en gezondheid, hoewel in tegenstelling tot de PGP de anonimiteit van de deelnemers behouden blijft.

Ook het 'retrofitten' van bestaande dataverzamelingsprojecten levert resultaat op. Als voorbeeld van wat kan worden bereikt, verwijst Dr. Lifton naar de Framingham Heart Study. Dit begon in 1948 en heeft verschillende generaties in de stad (nabij Boston) gevolgd om te proberen de oorzaken van hartaandoeningen en beroertes te ontrafelen. Het heeft een aantal genen onthuld die klassieke voorbeelden van donkere materie kunnen zijn.

Indien aanwezig als een enkele kopie geërfd van moeder of vader, beschermen bepaalde mutaties van deze genen tegen hartaandoeningen en beroertes. Die mutaties komen echter niet vaak genoeg voor om door conventionele GWAS te worden opgevangen. Aan de andere kant zullen individuen die twee exemplaren van hen erven, één van elke ouder, doodgeboren worden en dus kunnen ze ook niet worden gedetecteerd door klassieke Mendeliaanse tellingen.

Dit soort resultaten suggereert dat het logisch zou zijn om ieders medische gegevens in de genetische muil te gooien. Hoe groter de steekproef, hoe robuuster het uiteindelijke resultaat. Het belangrijkste bezwaar daartegen is privacy, en de mate waarin dit echt een probleem is, kan blijken uit het al dan niet succes van de benadering van Dr. Church. De PGP begon in maart serieus met rekruteren, dus alles zou snel duidelijk moeten zijn. Als het project een succes wordt, kan de opvatting dat iemands DNA zijn eigen zaak is, vervagen.

Maar ook als de data van de biobanken en de persoonlijke genoomprojecten binnen zijn, moeten ze nog worden omgezet in kennis die kan worden omgezet in geneesmiddelen. Data omzetten in kennis is de taak van mensen als Aviv Regev van het Broad Institute.Het zal een zware opgave zijn, waarbij nog meer sequentiebepaling nodig is (van RNA, in plaats van DNA, om te zien welke genen daadwerkelijk actief zijn in bepaalde soorten cellen) en veel rekenwerk (om de correlaties in activiteit te tonen die aangeven dat bepaalde moleculen delen van dezelfde biologische route).

De manier waarop Dr. Regev het beschrijft, lijkt erg op elektronica. Eerst moeten de componenten (de biologische equivalenten van transistors, diodes en weerstanden) worden geïdentificeerd. Dat zou nu kunnen worden gezien als 'klassieke' genomica. Vervolgens moeten die componenten worden samengevoegd tot modules (het equivalent van de logische poorten van een computer). Dat is waar de RNA-sequencing (samen met een groot aantal andere tools) om de hoek komt kijken. Ten slotte kunnen de modules als circuits worden gekoppeld en moet het hele apparaat van de cel duidelijk worden.

Het praktische voordeel van deze kennis is dat het circuit van de cel kan worden gewijzigd om gebroken bits te omzeilen in plaats van de onderbreking zelf te repareren. Dat opent een geheel nieuwe manier van denken over de ontwikkeling van geneesmiddelen. Voeg dat toe aan de overvloed aan nieuwe doelwitten, niet alleen in de vorm van de extra eiwitcoderende genen die zijn ontdekt door het oorspronkelijke genoomproject, maar ook van de RNA-only genen en het epigenoom, en de langetermijnkansen voor de farmacie zouden moeten worden Helder. Wie die kansen gaat benutten, valt nog te bezien. Want als het waar is dat de gevestigde farmaceutische bedrijven in de rijke wereld stodgy zijn geworden, ligt de genomische toekomst misschien ergens anders.


Bekijk de video: Wat is DNA en Hoe Werkt Het? (December 2021).