Informatie

Verwarring over de beschrijving van een gen


Ik heb een heel basale biologievraag. Ik lees hier de beschrijving van gen FAM166A en ik heb geen idee wat "sequentieovereenkomst 166" betekent. Waar staat 166 voor, waar is de sequentie van dit gen "vergelijkbaar met"? En wat betekent lid A?


De FAM-symbolen zijn gedefinieerd in de richtlijnen van het HUGO Gene Nomenclature Committee.

Het FAM-symbool is een anonieme en tijdelijke aanduiding die wordt gegeven aan groepen slecht gekarakteriseerde genen die meer dan 40% aminozuursequentie-identiteit delen (zie paragraaf 4.1).

Er zijn twee menselijke genen/eiwitten in de sequentieovereenkomst 166-groep; FAM166A en FAM166B. Deze hebben enige sequentieovereenkomst (meer dan 40%), maar de functie van deze vergelijkbare sequentie is momenteel niet bekend. Zodra verdere karakterisering is uitgevoerd voor een FAM-groep, zullen ze waarschijnlijk meer betekenisvolle namen krijgen.


Verwarring over de beschrijving van een gen - Biologie

RC Lewontin, Alexander Agassiz Professor Emeritus of Zoology aan de Harvard University, heeft een aantal boeken en artikelen geschreven over evolutie en menselijke variatie, waaronder Biology as Ideology: The Doctrine of DNA en The Triple Helix: Gene, Organism, and Environment

In de afgelopen vijfendertig jaar heeft er een grote verandering plaatsgevonden in ons biologische begrip van het concept van het menselijk 'ras', grotendeels als gevolg van een enorme toename van onze kennis van de menselijke genetica. Als een biologische in plaats van een sociale constructie, wordt 'ras' niet langer gezien als een fundamentele realiteit die de menselijke soort kenmerkt. Niettemin verschijnen er van tijd tot tijd beweringen dat raciale categorieën geen willekeurige sociaal en historisch gedefinieerde groepen vertegenwoordigen, maar objectieve biologische indelingen op basis van genetische verschillen. De meest recente wijdverbreide wedergeboorte van dergelijke beweringen is een essay van Armand Marie Leroi op de Op-Ed-pagina van The New York Times (14 maart 2005), een essay dat zowel de klassieke verwarring over de realiteit van raciale categorieën illustreert als de meer recente foutieve conclusies over de relevantie van dergelijke raciale identificaties voor de medische praktijk.

Er zijn vier feiten over menselijke variatie waarover universele overeenstemming bestaat. Ten eerste heeft de menselijke soort als geheel een enorme genetische variatie van individu tot individu. Elke twee niet-verwante mensen verschillen met ongeveer 3 miljoen verschillende DNA-varianten.

Ten tweede, veruit de grootste hoeveelheid van die variatie, ongeveer 85%, is onder individuen binnen lokale nationale of taalkundige populaties, binnen de Fransen, binnen de Kikuyu, binnen de Japanners. Er is diversiteit van populatie tot populatie in hoeveel genetische variatie elk bevat, afhankelijk van hoeveel immigratie in de populatie heeft plaatsgevonden vanuit een verscheidenheid aan andere groepen en ook van de grootte van de populatie. De Verenigde Staten, met een zeer grote populatie waarvan de voorouders van over de hele aarde kwamen, inclusief de oorspronkelijke bewoners van de Nieuwe Wereld, is genetisch zeer variabel, terwijl kleine populaties van lokale Amazone-stammen minder genetisch variabel zijn, hoewel ze geenszins genetisch uniform zijn . Ondanks de verschillen in hoeveelheid genetische variatie binnen lokale populaties, is de bevinding dat gemiddeld 85% van alle menselijke genetische variatie binnen lokale populaties ligt een opmerkelijk consistent resultaat van onafhankelijke onderzoeken die gedurende vijfentwintig jaar zijn uitgevoerd met behulp van gegevens van beide eiwitten en DNA.

Van de resterende 15% van de menselijke variatie is tussen de kwart en de helft tussen lokale populaties binnen klassiek gedefinieerde menselijke 'rassen', tussen de Fransen en de Oekraïners, tussen de Kikuyu en de Ewe, tussen de Japanners en de Koreanen. De resterende variatie, ongeveer 6% tot 10% van de totale menselijke variatie, is tussen de klassiek gedefinieerde geografische rassen die we in alledaagse zin beschouwen als geïdentificeerd door huidskleur, haarvorm en neusvorm. Deze onnauwkeurigheid bij het toewijzen van het aandeel variatie dat wordt toegewezen aan verschillen tussen populaties binnen 'rassen' in vergelijking met variatie tussen 'rassen', ontstaat juist omdat er geen objectieve manier is om de verschillende menselijke populaties toe te wijzen aan duidelijke rassen. In welk "ras" vallen de Hindi- en Urdu-sprekers van het Indiase subcontinent? Moeten ze worden gegroepeerd met Europeanen of met Aziaten of moet er een apart ras aan worden toegewezen? Zijn de Lappen van Finland en de Hazari van Afghanistan echt Europeanen of Aziaten? Hoe zit het met Indonesiërs en Melanesiërs? Verschillende biologen hebben verschillende opdrachten gemaakt en het aantal "rassen" dat door antropologen en genetici is toegewezen, varieerde van 3 tot 30.

Ten derde variëren een klein aantal genetische eigenschappen, zoals huidskleur, haarvorm, neusvorm (eigenschappen waarvoor de genen niet echt zijn geïdentificeerd) en relatief weinig eiwitten zoals de Rh-bloedgroep, samen, zodat veel populaties met zeer een donkere huidskleur heeft ook donker, strak gekruld haar, brede neuzen en een hoge frequentie van de Rh-bloedgroep R0. Degenen die, net als Leroi, pleiten voor de objectieve realiteit van raciale verdeeldheid, beweren dat wanneer een dergelijke covariatie in aanmerking wordt genomen, er duidelijke rassenscheidingen zullen verschijnen en dat deze verdelingen grotendeels zullen overeenkomen met de klassieke verdeling van de wereld in blanken, zwarten, Geel, rood en bruin. Het is inderdaad mogelijk om de informatie van covariërende kenmerken te combineren tot gewogen gemiddelden die rekening houden met de covariatie van de kenmerken (technisch bekend als "hoofdcomponenten" van variatie). Wanneer dit echter is gebeurd, hebben de resultaten de beweringen over raciale verdeeldheid niet bevestigd. De geografische kaarten van de belangrijkste componentwaarden, geconstrueerd door Cavalli, Menozzi en Piazza in hun beroemde De geschiedenis en geografie van menselijke genen vertonen continue variatie over de hele wereld zonder scherpe grenzen en met geen grotere gelijkenis tussen West- en Oost-Europeanen dan tussen Europeanen en Afrikanen! De klassiek gedefinieerde rassen blijken dus niet uit een onbevooroordeelde beschrijving van menselijke variatie. Alleen de Australische Aboriginals verschijnen als een unieke groep.

Een clustering van populaties die overeenkomt met klassieke continentale "rassen" kan worden bereikt door gebruik te maken van een speciale klasse van niet-functioneel DNA, microsatellieten. Door te selecteren uit microsatellieten, is het mogelijk om een ​​set te vinden die Afrikaanse populaties, Europese populaties en Aziatische populaties, enz. zal clusteren. Deze geselecteerde microsatelliet-DNA-markers zijn echter niet typisch voor genen, maar zijn gekozen juist omdat ze " maximaal informatief" over groepsverschillen. Zo vertellen ze ons wat we al wisten over de verschillen tussen populaties van de klassieke "rassen" van huidskleur, gezichtsvorm en haarvorm. Ze hebben als bijkomend voordeel dat we een goede schatting kunnen maken van de hoeveelheid vermenging die tussen populaties heeft plaatsgevonden als gevolg van migraties en veroveringen.

De dagelijks sociaal gedefinieerde geografische rassen identificeren groepen populaties die genetisch iets meer op elkaar lijken. Het belangrijkste vanuit het oogpunt van de biologische betekenis van deze raciale categorieën is echter dat de meeste menselijke genetische variatie niet zo'n "ras"-clustering vertoont. Voor de overgrote meerderheid van menselijke genetische variaties maken klassieke raciale categorieën zoals gedefinieerd door een combinatie van geografie, huidskleur, neus en haarvorm, een occasionele bloedgroep of geselecteerde microsatellieten geen bruikbare voorspelling van genetische verschillen. Dit falen van de clustering van lokale populaties in biologisch betekenisvolle "rassen" op basis van een paar duidelijke genetische verschillen is niet beperkt tot de menselijke soort. Zoölogen hebben lang geleden de categorie "ras" opgegeven voor het verdelen van groepen dierenpopulaties binnen een soort, omdat zo veel van deze rassen op slechts één of twee genen bleken te berusten, zodat twee dieren die in hetzelfde nest werden geboren, bij elkaar konden horen. naar verschillende 'rassen'.

In zijn artikel is Leroi inconsistent en verschuift hij in zijn notie van ras. Soms komt het overeen met de klassieke sociale definities van grote rassen, maar elders laat hij 'ras' samenvallen met een kleine lokale groep zoals de negrito's of de Inuit. In dit verschuivende begrip 'ras' grijpt hij terug op het wisselende gebruik van de term in de 19e eeuw. Toen sprak men over het "Schotse ras", "het Ierse ras" en het "ras van Engelsen". Inderdaad zou 'ras' kunnen staan ​​voor een familiegroep die wordt gedefinieerd door mannelijke overerving, zoals in de beschrijving van de laatste man in een familielijn als 'de laatste van zijn ras'. Dit inconsistente gebruik vloeit voort uit het feit dat er geen duidelijk criterium is van hoeveel verschil tussen groepen genetisch verwante individuen moet overeenkomen met de categorie "ras". Als was gebleken dat groepen verwante populaties in de overgrote meerderheid van hun genen duidelijk van andere groepen verschilden, dan zouden raciale categorieën duidelijk en ondubbelzinnig zijn en zouden ze een grote voorspellende kracht hebben voor nog niet bestudeerde karakters. Maar zo is het niet gegaan, althans niet voor de menselijke soort.

Het vierde en laatste feit over genetische verschillen tussen groepen is dat deze verschillen aan het afbrokkelen zijn vanwege de zeer grote hoeveelheid migratie en paring tussen groepen die in de geschiedenis van de menselijke soort altijd episodisch was, maar nu meer wijdverspreid is dan ooit. Het resultaat is dat individuen die door zichzelf of anderen worden geïdentificeerd als behorend tot één 'ras', gebaseerd op het kleine aantal zichtbare karakters dat wordt gebruikt in klassieke rasdefinities, waarschijnlijk een voorouders hebben die een mengsel is van deze groepen, een feit dat aanzienlijke betekenis voor de medische toepassingen van rasidentificatie.

Een veelgehoorde bewering, herhaald door Leroi, is dat raciale categorieën van groot medisch nut zijn, vooral bij diagnostisch testen, omdat sommige genetische aandoeningen zeer vaak voorkomen bij voorouderlijke raciale populaties. Sikkelcelanemie komt bijvoorbeeld veel voor onder West-Afrikanen, die als slaven naar de Nieuwe Wereld werden gebracht, en de ziekte van Tay-Sachs komt veel voor onder Asjkenazische joden. Dus, zo wordt betoogd, kan raciale informatie een nuttige diagnostische indicator zijn. Zeker, het klassieke "ras" bevat in sommige gevallen medisch relevante informatie, zoals bijvoorbeeld "wit" in tegenstelling tot "Afrikaans-Amerikaans" als het contrast tussen Finland en West-Afrika is, maar niet als het een contrast is tussen een "wit" Middellandse Zeegebied en een "Aziatische" indiaan. Er is hier een verwarring tussen ras en afkomst. Sikkelcelanemie komt veel voor, niet alleen bij West-Afrikanen, maar ook bij sommige "blanke" bevolkingsgroepen uit het Midden-Oosten en India. Bovendien heeft een persoon met, laten we zeggen, één Afrikaanse overgrootouder, maar die door haarzelf en anderen als 'wit' wordt geïdentificeerd, een kans van één op acht om een ​​sikkelcelmutatie te erven die door die voorouder wordt gedragen. Daarnaast zijn er een aantal andere eenvoudig overgeërfde hemoglobineafwijkingen, de thalassemieën, die op sommige plaatsen in de Middellandse Zee (Sardinië), Arabië en Zuidoost-Azië veel voorkomen. De hoogste frequentie die bekend is voor thalassemie (80%) is in Nepal, maar is zeldzaam in het grootste deel van Azië. De classificatie van individuen simpelweg als "blanke" of "Afro-Amerikaans" of "Aziatisch" zal ertoe leiden dat er niet wordt getest op dergelijke abnormale hemoglobines omdat deze afwijkingen niet kenmerkend zijn voor het geïdentificeerde "ras" van de patiënt. Zelfs groepsidentiteiten onder het niveau van de conventionele rassen zijn misleidend. Twee van mijn onbetwistbare WASP-kleinkinderen hebben een alleenstaande Ashenazi-joodse overgrootouder en hebben dus een kans van één op acht om een ​​Tay-Sachs-afwijking van die voorouder te erven. Voor medische tests willen we niet weten of een persoon "Spaans" is, maar eerder of de familie van die persoon uit een Caribisch land zoals Cuba kwam, waar een grote toestroom van West-Afrikaanse slaven was, of een land waar een veel vermenging met inheemse Amerikaanse stammen zoals in Chili en Mexico, of met een verwaarloosbare populatie van niet-Europeanen. Rasidentificatie doet eenvoudigweg niet het benodigde werk. Wat we zouden moeten vragen op medische vragenlijsten is geen raciale identificatie, maar afkomst. "Kent u voorouders die dat waren (Asjkenazische joden, of uit West-Afrika, uit bepaalde regio's van de Middellandse Zee, uit Japan)?" Nogmaals, raciale categorisering is een slechte voorspeller van biologie.

Er is een interessante dialectiek geweest tussen het begrip mensenrassen en het gebruik van ras als een algemene biologische categorie. Historisch gezien werd het concept van ras geïmporteerd in de biologie, en niet alleen de biologie van de menselijke soort, vanuit de sociale praktijk. Het bewustzijn dat mensen in verschillende variëteiten voorkomen, leidde in de geschiedenis van de biologie tot de constructie van 'ras' als een subgroep binnen soorten. Lange tijd was de categorie “ras” een standaard taxonomisch niveau. Maar het gebruik van "ras" in een algemene biologische context versterkte vervolgens de toepassing ervan op mensen. Veel dier- en plantensoorten zijn immers onderverdeeld in rassen, dus waarom niet Homo sapiens? Toch was de indeling van dier- en plantensoorten in rassen met een naam te allen tijde een slecht gedefinieerde en eigenaardige praktijk. Er was geen duidelijk criterium van wat een ras van dieren of planten was dat kon worden toegepast op soorten in het algemeen. Het groeiende besef in het midden van de twintigste eeuw dat de meeste soorten enige genetische differentiatie van lokale populatie tot lokale populatie hadden, leidde uiteindelijk tot het opgeven in de biologie van elke hoop dat een uniform criterium voor ras kon worden geconstrueerd. Toch hadden biologen er een hekel aan om het idee van ras volledig los te laten. In een poging het concept vast te houden en tegelijkertijd objectief en generaliseerbaar te maken, heeft Th. Dobzhansky, de toonaangevende bioloog in de studie van de genetica van natuurlijke populaties, introduceerde het 'geografische ras', dat hij definieerde als elke populatie die genetisch op enigerlei wijze verschilde van elke andere populatie van de soort. Maar naarmate de genetica zich ontwikkelde en het mogelijk werd om de genetische verschillen tussen individuen en populaties te karakteriseren, werd het duidelijk dat: elk De populatie van elke soort verschilt in feite tot op zekere hoogte genetisch van elke andere populatie. Elke populatie is dus een afzonderlijk "geografisch ras" en men realiseerde zich dat er niets werd toegevoegd door de raciale categorie. Het gevolg van dit besef was het opgeven van 'ras' als biologische categorie in het laatste kwart van de twintigste eeuw, een afstand die zich verspreidde in de antropologie en de menselijke biologie. In het geval van de menselijke soort was dat opgeven echter nooit volledig. Er is een constante druk geweest van de sociale en politieke praktijk en het samenvallen van raciale, culturele en sociale klassendelingen die de sociale realiteit van ras versterken, om "ras" als een menselijke classificatie te behouden. Als men zou toegeven dat de categorie 'ras' een puur sociale constructie is, zou de legitimiteit ervan echter zijn verzwakt. Er zijn dus herhaalde pogingen geweest om de objectieve biologische realiteit van menselijke raciale categorieën opnieuw te bevestigen, ondanks het bewijs van het tegendeel.


Een overzicht van nomenclaturen: genen, straten en sterren

Voor menselijke waarnemers is het genoom slechts het nieuwste voorbeeld van een enorm, gedeeltelijk begrepen landschap van te labelen objecten. Baanbrekende ontdekkingsreizigers, cartografen, astronomen en stadsplanners stonden allemaal voor een vergelijkbare taak: het genereren van nomenclaturen met een verscheidenheid aan samenhang. Straatnamen binnen steden geven een goede analogie met genen binnen soorten. Noord-Amerikaanse steden delen bijvoorbeeld vaak een corpus van bewaarde straatnamen, waarvan sommige nuttige informatie bevatten (denk aan Church Street of College Street). Dit komt tot uiting in de gezond verstand naamgeving van bepaalde 'landmark' genen en eiwitten (bijvoorbeeld die voor ribosomen) in de meeste soorten. Natuurlijk is het mogelijk dat namen hun betekenis verliezen (hoewel de kerk wordt gesloopt, blijft Church Street over). Evenzo blijken sommige genen waarvan de naam hun functie beschrijft later een heel andere activiteit uit te voeren.

Een centrale planningsbenadering van naamgeving, zowel in steden als in genen, is verstandig, maar vaak flauw. Genen in veel nieuw gesequenced organismen worden benoemd volgens een rigoureus systeem (bijvoorbeeld sequentiële open leeskadernummering), net zoals bepaalde nieuwere steden zich houden aan een rationeel systeem (denk aan het plan van Pierre l'Enfant voor Washington DC of het genummerde raster van Manhattan ).

In de astronomie komen de namen van de oerhemellichamen - de zon en de maan - uit de prehistorie tot ons. De sterrenbeelden werden enkele duizenden jaren geleden genoemd op basis van hun gelijkenis met dieren en mythische wezens. Romeinse astronomen gaven namen van goden voor de planeten in overeenstemming met hun waargenomen kenmerken. Deze nomenclatuur volstond totdat steeds krachtigere telescopen oneindig veel astrale objecten onthulden om op te noemen. Dienovereenkomstig evolueerde de hemelnomenclatuur naar een pseudo-consistent systeem van genummerde sterrenstelsels, sterren en andere objecten. Het resulterende bricolage van astronomische namen parallellen die gevonden worden in de gennomenclatuur: een beheersbare set van initiële kernobjecten maakt plaats voor golven van thematische naamgeving, totdat de lawine van nieuwe genen veroorzaakt door grootschalige sequencing ons dwingt tot flauwe, systematische identifiers.


De evoluerende definitie van de term "gen"

Dit artikel presenteert een geschiedenis van de veranderende betekenissen van de term 'gen' gedurende meer dan een eeuw, en een bespreking van waarom dit woord, dat zo cruciaal is voor de genetica, vandaag opnieuw moet worden gedefinieerd. In dit verslag worden de eerste twee fasen van de 20e-eeuwse genetica de 'klassieke' en de 'neoklassieke' periodes genoemd, en het huidige moleculair-genetische tijdperk de 'moderne periode'. Terwijl de eerste twee stadia steeds meer duidelijkheid brachten over de aard van het gen, kenmerkt de huidige periode zich door complexiteit en verwarring. Aanvankelijk werd de term 'gen' bedacht om een ​​abstracte 'overervingseenheid' aan te duiden, waaraan geen specifieke materiële kenmerken waren toegewezen. Naarmate de klassieke en neoklassieke periodes zich ontvouwden, werd de term concreter, eerst als een dimensieloos punt op een chromosoom, dan als een lineair segment binnen een chromosoom, en tenslotte als een lineair segment in het DNA-molecuul dat codeert voor een polypeptideketen. Deze laatste definitie, uit het begin van de jaren zestig, wordt nog steeds gehanteerd, maar de ontwikkelingen sinds de jaren zeventig hebben de algemeenheid ervan ondermijnd. Ze roepen inderdaad vragen op over zowel het nut van het concept van een fundamentele 'overervingseenheid' als de lange impliciete overtuiging dat genen autonome agenten zijn. Hier bespreken we bevindingen die de klassieke moleculaire definitie achterhaald hebben gemaakt en stellen we een nieuwe voor op basis van hedendaagse kennis.

trefwoorden: functie gen gennetwerken regulering structuurtheorie.


Wetenschappers ontdekken verband tussen genen en transgender zijn

Onderzoekers van het Hudson Institute of Medical Research in Melbourne, Australië, hebben ontdekt dat genderdysforie een biologische basis kan hebben.

De studie onderzocht de genetische variaties van 380 transgender vrouwen en vergeleek ze met die van niet-transgender mannen.

Bij de transgendervrouwen vonden ze een significante oververtegenwoordiging van vier genen die betrokken zijn bij de verwerking van geslachtshormonen. Deze variatie suggereert een mogelijke biologische reden waarom bepaalde mensen genderdysforie ervaren.

Degenen achter de studie stellen dat deze genetische variaties van invloed kunnen zijn op het vermogen van de mannelijke hersenen om androgeen te verwerken, wat betekent dat de hersenen zich anders ontwikkelen op een manier die minder "8220mannelijk" is en meer "vrouwelijk", wat bijdraagt ​​aan het geslacht dysforie bij transgender vrouwen.

De studie is door hoofdauteur professor Vincent Harley als de grootste en meest uitgebreide in zijn soort beschouwd.

In een gesprek met de Australian Broadcasting Company zei Harley: "Hoewel het niet afhankelijk mag zijn van de wetenschap om de individualiteit en levenservaring van mensen te valideren, kunnen deze bevindingen helpen om discriminatie te verminderen."

Het aantonen van een verband tussen genderdysforie en genetica kan mogelijk de diagnose verbeteren en de sociale acceptatie van transgenders vergroten.

Uit een rapport van 2017, uitgevoerd door het Telethon Kids Institute, bleek dat ongeveer drie op de vier transgenders tussen de 14 en 25 jaar angst of depressie ervaren en dat vier op de vijf zelfbeschadiging hebben gepleegd. Het rapport onthulde ook de alarmerende statistiek dat bijna de helft van alle ondervraagde jonge transgenders een zelfmoordpoging heeft ondernomen.

Fran was een van de transgendervrouwen die meedeed aan het onderzoek van het Hudson Institute. Ze vertelde het ABC: 'De mentale reis van zelfacceptatie is echt een van de dominante kenmerken van mijn leven geweest.'8221

Deze studie draagt ​​bij aan een groeiend onderzoeksveld dat suggereert dat er een biologische basis is voor transgender-identiteiten. Ondanks dat hij dieper ingaat op hoe iemand zich man of vrouw voelt, benadrukt Harley dat genen niet de enige factoren zijn die een rol spelen bij het bepalen van genderidentiteit.


Materialen en methodes

SO en SOFA zijn gebouwd en worden onderhouden met behulp van de ontologie-editing tool OBO-Edit. De ontologieën zijn beschikbaar op [34].

De FlyBase D. melanogaster [35]-gegevens zijn afgeleid van de GadFly [36] relationele database en geconverteerd naar Chaos-XML met behulp van de Bio-chaos-tools. De functies werden geannoteerd tot het diepst mogelijke concept in de ontologie, gezien de beschikbare informatie. De mate van informatie in annotaties was bijvoorbeeld voldoende diep om de transcriptkenmerken te beschrijven met het type RNA zoals: mRNA, of tRNA. Het was daarom mogelijk om de analyse te beperken tot bepaalde typen transcripten. CGL-tools werden gebruikt om elk van de annotaties te valideren, de genen te doorlopen en de functies te doorzoeken. EM-operators werden toegepast op de deelkenmerken van genen.

Andere gegevens over organismen zijn afgeleid van de genomen sectie van GenBank [37]. GenBank flat-bestanden werden geconverteerd naar SO-compliant Chaos-XML met behulp van het script cx-genbank2chaos.pl (beschikbaar vanaf [19]) en BioPerl [23]. De BioPerl GenBank-parser, Bio::SeqIO::genbank, werd gebruikt om platte GenBank-bestanden om te zetten naar Bioperl SeqFeature-objecten. Feature_relaties tussen deze objecten werden afgeleid uit locatie-informatie met behulp van de Bioperl Bio::SeqFeature::Tools::Unflattener-code. GenBank Feature Table-typen zijn geconverteerd naar SO-termen met behulp van de Bio::SeqFeature::Tools::TypeMapper-klasse, die een hardcoded mapping bevat voor de subset van de GenBank Feature Table die momenteel wordt gebruikt in de genomen sectie van GenBank. Dezelfde Perl-klasse werd gebruikt om de feature_relationships te typen volgens SO-relatietypes. De EM-analyse werd uitgevoerd over de Chaos-XML-annotaties met behulp van de CGL-suite van modules om de delen van elk gen te herhalen.


Moleculaire biologie

Onze redacteuren zullen beoordelen wat je hebt ingediend en bepalen of het artikel moet worden herzien.

Moleculaire biologie, wetenschapsgebied dat zich bezighoudt met het bestuderen van de chemische structuren en processen van biologische fenomenen waarbij de basiseenheden van het leven, moleculen, betrokken zijn. Het vakgebied van de moleculaire biologie is vooral gericht op nucleïnezuren (bijv. DNA en RNA) en eiwitten - macromoleculen die essentieel zijn voor levensprocessen - en hoe deze moleculen op elkaar inwerken en zich binnen cellen gedragen. Moleculaire biologie ontstond in de jaren dertig van de vorige eeuw en is vandaag de dag nog steeds nauw verbonden met die gebieden.

Er zijn verschillende technieken ontwikkeld voor moleculaire biologie, hoewel onderzoekers in het veld ook methoden en technieken kunnen gebruiken die eigen zijn aan de genetica en andere nauw verwante gebieden. In het bijzonder probeert de moleculaire biologie de driedimensionale structuur van biologische macromoleculen te begrijpen door middel van technieken zoals röntgendiffractie en elektronenmicroscopie. De discipline probeert met name de moleculaire basis van genetische processen te begrijpen. Moleculair biologen brengen de locatie van genen op specifieke chromosomen in kaart, associëren deze genen met bepaalde karakters van een organisme en gebruiken genetische manipulatie (recombinante DNA-technologie) om specifieke genen. Deze benaderingen kunnen ook technieken omvatten zoals polymerasekettingreactie, western blotting en microarray-analyse.

In de beginperiode van de jaren veertig hield de moleculaire biologie zich bezig met het ophelderen van de driedimensionale basisstructuur van eiwitten. Door toenemende kennis van de structuur van eiwitten in het begin van de jaren vijftig kon de structuur van deoxyribonucleïnezuur (DNA) - de genetische blauwdruk die in alle levende wezens wordt aangetroffen - in 1953 worden beschreven. Verder onderzoek stelde wetenschappers in staat om een ​​steeds gedetailleerdere kennis te krijgen, niet alleen van DNA en ribonucleïnezuur (RNA), maar ook van de chemische sequenties in deze stoffen die de cellen en virussen instrueren om eiwitten te maken.

Moleculaire biologie bleef een pure wetenschap met weinig praktische toepassingen tot de jaren zeventig, toen bepaalde soorten enzymen werden ontdekt die DNA-segmenten in de chromosomen van bepaalde bacteriën konden knippen en recombineren. De resulterende recombinant-DNA-technologie werd een van de meest actieve takken van de moleculaire biologie omdat het de manipulatie mogelijk maakt van de genetische sequenties die de basiskenmerken van organismen bepalen.


Stemmen van de nieuwe generatie: wetenschap in een staat van goedaardige verwarring

Het opzetten van een onderzoeksgroep in China (wanneer je de taal niet machtig bent) betekent dat je met dezelfde problemen wordt geconfronteerd als elders, met een extra beetje verwarring.

Mijn onderzoeksgroep computationele biologie aan de Fudan University, waarmee ik in september 2018 begon, werkt aan het wereldwijde microbioom. We proberen de ecologische processen achter de microbiële ecologie van de hele aarde te begrijpen en proberen vragen te beantwoorden zoals hoe genen en soorten ontstaan, hoe ze evolueren en wat ze doen. We benaderen dit probleem computationeel, door grote datasets van metanomen te analyseren.

Mijn sollicitatiegesprek aan de Fudan University, in Shanghai, was mijn eerste bezoek aan China. Hierheen verhuizen was niet mijn eerste internationale ervaring: ik heb gestudeerd en gewerkt in Portugal, de VS en Duitsland, en ik spreek en schrijf in verschillende Europese talen. In China ben ik echter vertrouwd geraakt met een alledaags gevoel van goedaardige verwarring.

Aangezien mijn Mandarijn genereus kan worden omschreven als rudimentair, en weinig mensen buiten de universitaire omgeving vloeiend Engels spreken, is communicatie vaak een raadselachtige stompzinnigheid. Ik red me met gebaren, automatische vertaling, mijn verkeerd uitgesproken Mandarijn en overvloedige glimlachen. Verwarring is onvermijdelijk. Als je echter nederigheid toont in plaats van recht te hebben, zijn mensen erg vriendelijk en begrijpen ze je onwetendheid. Goedaardige verwarring dus.

In verrassende mate lijkt mijn werk erg op wat het elders zou zijn. Een typische pre-COVID-19-dag omvatte het ophalen van een flat white in het hippe campuscafé op weg naar kantoor, het beantwoorden van e-mails, het werken aan subsidies en manuscripten, het ontmoeten van stagiairs en, als de tijd het toelaat, het lezen van papers. Ik doe het in het Engels en dien in bij dezelfde tijdschriften en conferenties als mijn internationale collega's. Twitter- en Slack-groepen zijn van onschatbare waarde om het wetenschappelijke gesprek bij te houden.

Subsidies zijn beschikbaar uit verschillende Chinese bronnen: nationale subsidies, stadssubsidies en ik heb zelfs wat geld ontvangen van onze buurt. (Voor het perspectief: met meer dan een miljoen inwoners is onze buurt groter dan sommige van de kleinere Europese landen.) Zoals overal, schrijf je om een ​​subsidie ​​aan te vragen een voorstel waarin je het wetenschappelijke belang van je ideeën en je vermogen om ze te testen bepleit. Hoewel subsidies in het Engels kunnen worden ingediend, is veel van de informatie hierover alleen in het Chinees beschikbaar. Daarom moet ik vertrouwen op mijn afdeling en collega's om deze informatie te delen.

Wanneer er roep om internationale samenwerking is, bieden mijn contacten buiten China mij extra kansen. Zo maken we momenteel deel uit van een door JPIAMR gefinancierde samenwerking om te werken aan antimicrobiële resistentie, met partners in Europa en Pakistan. Als onderdeel van deze consortia heb ik vaak te maken met impedantiemismatches tussen administratieve systemen. Natuurlijk moeten we contracten en documenten vertalen, wat zorgt voor meer papierwerk. De echte problemen beginnen echter wanneer een partner een document nodig heeft dat geen equivalent heeft in China, of omgekeerd. Hoewel sommige van deze problemen zelfs binnen Europa zouden bestaan, zijn ze veel groter tussen dergelijke verschillende administratieve systemen.

Desalniettemin zijn veel van de problemen waarmee ik hier te maken heb dezelfde als die waarmee junior groepsleiders overal worden geconfronteerd. Bijvoorbeeld, als de financiering eenmaal rond is, hoe postdocs en studenten aan te trekken, wanneer je concurreert met meer gevestigde onderzoekers om talent. Inderdaad, de eerste zes maanden van mijn werk bestond mijn 'groep' alleen uit mezelf, alleen aan mijn computer. Het voelde soms als een anticlimatisch vervolg op mijn postdoc.

Uiteindelijk had ik het geluk dat ik een paar getalenteerde studenten en een buitengewone postdoc bij mijn groep had. Langzaam veranderde de structuur van het werk. Toen, op een dag, nam ik een pauze en ging naar de afdelingslounge om een ​​kopje koffie te halen. Toen ik binnenkwam, zag ik dat ‘mijn’ studenten en postdoc samen zaten met een gastspreker over wetenschap. Op dat moment realiseerde ik me dat ik eindelijk een onderzoeksgroep had opgericht.


Genen worden geërfd door zowel ongeslachtelijke voortplanting als seksuele voortplanting. Bij ongeslachtelijke voortplanting zijn de resulterende organismen genetisch identiek aan een enkele ouder. Voorbeelden van dit type reproductie zijn ontluikende, regeneratie en parthenogenese.

Seksuele reproductie omvat de bijdrage van genen van zowel mannelijke als vrouwelijke gameten die samensmelten tot een afzonderlijk individu. De eigenschappen die deze nakomelingen vertonen, worden onafhankelijk van elkaar overgedragen en kunnen het gevolg zijn van verschillende soorten overerving.

  • Bij volledige dominantie overerving is één allel voor een bepaald gen dominant en maskeert het andere allel voor het gen volledig.
  • Bij onvolledige dominantie is geen van beide allelen volledig dominant over de andere, wat resulteert in een fenotype dat een mengsel is van beide ouderfenotypes.
  • Bij co-dominantie komen beide allelen voor een eigenschap volledig tot uiting.

Wat is afkomst?

Auteursrechten: © 2020 Mathieson, Scally. Dit is een open access-artikel dat wordt gedistribueerd onder de voorwaarden van de Creative Commons Attribution-licentie, die onbeperkt gebruik, distributie en reproductie in elk medium toestaat, op voorwaarde dat de oorspronkelijke auteur en bron worden vermeld.

Financiering: Dit onderzoek werd ondersteund door een Research Fellowship van de Alfred P. Sloan foundation [FG-2018-10647], een New Investigator Research Grant van de Charles E. Kaufman Foundation [KA2018-98559], en NIGMS award nummer [R35GM133708] aan IM De inhoud is uitsluitend de verantwoordelijkheid van de auteurs en vertegenwoordigt niet noodzakelijk de officiële standpunten van de National Institutes of Health. De financiers hadden geen rol bij het ontwerp van de studie, het verzamelen en analyseren van gegevens, de beslissing om het manuscript te publiceren of de voorbereiding van het manuscript.

Concurrerende belangen: De auteurs hebben verklaard dat er geen concurrerende belangen bestaan.

Ancestry connects genetics and society in fundamental ways. For many people it has cultural, religious or even political significance, and can play a key role in shaping personal and public identities. People’s desire to discover their own ancestry drives the multibillion-dollar genealogy industry, which has grown rapidly in the era of consumer genomics. Companies such as 23andMe and Ancestry now claim tens of millions of customers worldwide. In parallel, our scientific understanding of the human past is being transformed by studies of ancient and modern genetic data, which allow us to track changes in ancestry over space and time. Sophisticated methods have been developed to infer and visualise these relationships. Thus, it seems that both scientists and the wider public are learning more and more about ancestry, and there is an optimistic sense that genetic data provide an exhaustive repository of ancestral information.

However, although frequently discussed, ancestry itself is rarely defined. We argue that this reflects widespread underlying confusion about what it means in different contexts and what genetic data can really tell us. This leads to miscommunication between researchers in different fields, and leaves customers open to spurious claims about consumer genomics products and overinterpretation of individual results.

In wider usage, the terms ancestry and ancestors often indicate a general connection to people or things in the past. But in a genetic context they have a more specific meaning: your ancestors are the individuals from whom you are biologically descended and ancestry is information about them and their genetic relationship to you. Even here however, confusion arises from the way that ancestry is presented and discussed. Rather than emphasising its complex structure, results are often simplified in terms of discrete categories. While convenient and sometimes useful, ultimately this is misleading about the nature of ancestry. These labels can also impose contemporary political or cultural divisions which may be misrepresentative of ancestral relationships.

Another source of confusion is that three distinct concepts–genealogical ancestry, genetic ancestry, and genetic similarity–are frequently conflated. We discuss them in turn, but note that only the first two are explicitly forms of ancestry, and that genetic data are surprisingly uninformative about either of them. Consequently, most statements about ancestry are really statements about genetic similarity, which has a complex relationship with ancestry, and can only be related to it by making assumptions about human demography whose validity is uncertain and difficult to test.

Genealogical ancestry probably reflects the most common and intuitive understanding of the term ancestry. Consider your parents, grandparents, or even great-grandparents. You likely have a sense of these people as individuals, even if you have never met them. If one of them belonged to a particular group X, you might say that you have some “X” ancestry. You might even be able to claim ancestry in this way from more distant ancestors, based on historical or genealogical records. Thus genealogical ancestry is defined in terms of identifiable ancestors in your family tree or pedigree. Often it may be quantified for example, if one of your eight great-grandparents belonged to X you might describe yourself as “one eighth X”. N generations ago you have at most 2 N genealogical ancestors, and if some proportion of them belonged to X you might claim that proportion of ancestry from X.

There are two concepts here: the pedigree, which specifies how all your genealogical ancestors are related to each other, and the ancestry category ‘X’ which ascribes a characteristic of interest to some of them. The pedigree can be thought of as a graph, with nodes representing your genealogical ancestors connected by edges representing parent-child relationships between them (Fig 1A). Were we able to draw it in full it would be impracticably large, but in principle from a pedigree alone we can deduce facts about relatedness, for example that Charles Darwin’s wife Emma was his first cousin (and therefore approximately one eighth of their genomes were identical). Importantly, whereas the pedigree is fixed, ancestry categories can be arbitrary, reflecting aspects of ancestry that we happen to be interested in. X for example could be “British”, “English”, “Huguenot”, or any label referring to culture, geography or some other aspect of an individual’s identity.

EEN: The pedigree of a single individual. Circles indicate specific ancestors that could be used to define ancestry categories. B: At any single position in the diploid genome, genetic ancestry over the past N generations traces two paths (red and blue) through the, at most, 2 N available. C: Genetic ancestry in the form of the ARG for a single individual. Combining genetic ancestry from different positions leads to a graph, incorporating all realized genetic ancestry paths, implicitly passing through points representing specific individuals. The ARG is contained within the structure of the pedigree, with nodes corresponding to ancestors in which there was a recombination or coalescence event, and edges or lines between them representing paths of descent (through other ancestors which are not represented) for particular segments of DNA. NS: The ARG is usually used in the context of the merged ARGs of multiple individuals.

Thus, to describe your genealogical ancestry requires knowledge of your ancestors, the pedigree relating them to you, and sufficient information to assign them to categories of interest. In practice however, few people have comprehensive knowledge of their ancestors beyond a handful of generations ago. Even when researching their genealogy, people tend to focus on a small number of lineages for which records exist or which are of particular interest, neglecting the exponential growth in the number of genealogical ancestors back in time. Genetic data can help with this limitation through genetic genealogy, which identifies relatives based on the distinctive patterns of genetic variation they share. Knowledge of your relatives, while not ancestry in itself, can facilitate the pooling of information about shared ancestors in combination with traditional genealogical information. However, this information may still be difficult to obtain. This limitation raises the question of whether there is a form of ancestry that could be learned from genetic data alone.

The natural definition of this kind of ancestry is genetic ancestry, which differs from genealogical ancestry in that it refers not to your pedigree but to the subset of paths through it by which the material in your genome has been inherited. Because parents transmit only half their DNA to offspring each generation, an individual’s genetic ancestry involves only a small proportion of all their genealogical ancestors [1,2]. At any given position in one of your chromosomes, your DNA is inherited through one of the many possible paths through your pedigree (Fig 1B). Different positions in the genome may have different paths of inheritance, because parental chromosomes are shuffled together during meiotic recombination. Thus the difference between genealogical and genetic ancestry can be summed up by the observation that full siblings have identical genealogical ancestry but differ in their genetic ancestry, due to differences in the transmission of chromosomal segments from their parents.

The fundamental representation of genetic ancestry is a structure called an ancestral recombination graph (ARG Fig 1C) [3]. The ARG is central to population genetics, and many methods for making inferences about demographic history proceed by either implicitly or explicitly reconstructing ARGs [4–7]. Recalling the graph structure of an individual’s pedigree, the ARG is a subset of the pedigree representing the ancestry of the DNA inherited by that individual. It contains only those edges along which inherited segments of DNA have been transmitted, and only those nodes corresponding to ancestors in which there was a recombination or coalescence event. The ARG therefore tells you which parts of your genome were inherited from which ancestors, and represents all the ancestral information that can be obtained from genetic data alone. For example, your pedigree includes many ancestors from whom you inherited no genetic material, but such ancestors are not included in the ARG, and your genome cannot provide any information about them. The ARG can also be used to represent the genetic ancestry of a sample of multiple individuals by merging the individual ARGs into a single graph (Fig 1D).

Just as for genealogical ancestry, we may want to summarize the genetic ancestry of an individual in terms of particular groups or categories of interest. If we could identify specific ancestors in the ARG (Fig 1C) then, analogous to genealogical ancestry, we could say that an individual has genetic ancestry in a given category if any edge in his or her ARG passes through an ancestor in that category. In other words, genetic ancestry in category X means that some fraction of an individual’s genome is inherited directly from an ancestor in X. Genetic ancestry in X implies genealogical ancestry in X, but not vice versa. And as with genealogical ancestry, we could extend this approach to summarizing genetic ancestry by counting the proportion of an individual’s genome inherited from ancestors in X.

One factor motivating interest in particular ancestors or categories may be the idea that such ancestry is associated with genetic effects on certain traits. Whether this is plausible or not, genetic ancestry appears to provide an essentialist notion of ancestry that excludes any relationship that does not correspond to an inherited DNA segment. However, it turns out that determining genetic ancestry is even less practical an idea than genealogical ancestry. Whereas at least some of the pedigree may be pieced together from genealogical records, the ARG must be inferred solely from patterns of genetic variation–a very challenging problem (despite impressive recent progress [7,8]). Even if we could reconstruct the true ARG and the ancestors on each edge, we would have the same problem of needing information about membership in specific ancestry categories in order to give meaningful summaries.

The impracticality of fully determining either form of ancestry means that most analyses take an alternative approach. Typically, they aim to infer an approximate summary of genetic ancestry without reconstructing the ARG. For example, researchers may be interested in the demographic relationships between human populations but not necessarily the details of individual ancestors. Perhaps the closest we can practically get to this is an admixture graph [9,10], which relies on a concept of “population ancestry”, embedded in a graph which is similar to the ARG but relates populations rather than individuals. In any real population, individuals will differ in their ancestry and the true ARG will be extremely complex. The admixture graph focuses on the idea that, when averaged over the whole genome, these differences can be approximated as varying proportions of ancestry from multiple source populations. Since populations are explicitly represented as nodes in the admixture graph, it is more straightforward to attribute ancestry categories to them (compared to an ARG or pedigree), which makes this an appealing way to summarize ancestry. However there are drawbacks: populations may be poorly sampled or include unrepresentative individuals, or they may not correspond to identifiable groups. It is hard to know whether the inferred sources of ancestry (sometime called “ghost populations”) are real but unsampled populations or simply algorithmic constructs representing a simplification of more complex demography. More fundamentally, admixture graphs enforce the idea of discrete populations in a way which is at odds with the complexity of human demographic structure. For now they remain rare outside the population genetic literature, and care is needed in presenting them to a wider audience, as they represent an abstraction of ancestral demography which can easily be misinterpreted as something more concrete.

More commonly, when geneticists and consumer genomics companies talk about ancestry they are really talking about genetic similarity between populations and individuals. For example, the output of methods that summarize genetic variation among samples such as principal component analysis (PCA), ADMIXTURE [11] (an implementation of the STRUCTURE model [12]) and Chromopainter [13] (based on the Li & Stephens haplotype copying model [14]) are frequently interpreted in terms of ancestry. Some of these methods allow individual genomes to be represented as combinations of reference populations, which are either explicitly defined in terms of other individuals in the dataset, or constructed implicitly as part of the algorithm. These are ‘ancestry-like’ relationships, and since the ARG contains all the information about the evolutionary genetic process which produced the differences between samples, the outputs of these methods can be seen as summaries of the ARG (Fig 2).


Bekijk de video: 2. Chromosomen en genen 2hv (December 2021).