Informatie

Embryonale cellen, wanneer kun je ze in vivo detecteren? (Om het hele genoom te sequencen)


Ik vroeg me af wanneer het mogelijk is om cellen (mensen of muizen) te extraheren om ze te sequensen en ziekten op te sporen. Extra: Urine van het embryo bij mensen wordt uitgescheiden in de 16e week, dus ik denk dat het dan mogelijk is om enkele embryocellen te extraheren.

EDIT Met andere woorden, wanneer is het mogelijk om genoeg DNA te pakken om het volledige genoom van het embryo te kennen zonder het te beschadigen? Om het te sequensen en de meeste genetische ziekten te voorkomen en de wekelijkse abortuslimieten te reguleren.

Bedankt


Zoals gewoonlijk is het antwoord "het hangt ervan af wat je bedoelt". Er is een groot bestaand veld (prenataal genetisch diagnostisch testen) dat probeert genetische ziekten bij foetussen te diagnosticeren met behulp van verschillende technologieën. Deze technologieën worden meer beschreven in de punten 2 en 3 hieronder, terwijl punt 1 een enigszins academische uitspraak is over de technische mogelijkheden van genomische technologie in pure onderzoeksomgevingen die momenteel niet echt relevant zijn voor medische toepassingen.

Ik kan 3 verschillende antwoorden bedenken op de vraag zoals deze oorspronkelijk werd gesteld:

  1. Met de momenteel beschikbare sequentietechnologie kun je nooit de volledige genoomsequentie van een mens goed genoeg kennen om alle potentieel schadelijke varianten te zien. Het "voltooide" menselijke referentiegenoom heeft in feite hiaten en fouten die voortdurend worden gecorrigeerd. Voor meer informatie over wat "voltooid" betekent, zie hier. Voor zover ik weet bestaat er maar één assemblage van een telomeer-naar-telomeer menselijk chromosoom, en dat is alleen het X-chromosoom. Zelfs als we accepteren dat deze best beschikbare technologie goed genoeg is, is het ook afhankelijk van zaken als het vermogen om veel DNA met een hoog moleculair gewicht te isoleren, wat het erg moeilijk maakt om te doen met de hoeveelheid cellen die je van een pasgeborene zou kunnen krijgen zonder hoge invasieve procedures zoals bijv bemonstering van foetaal weefsel in vivo. Ik vermoed dat zelfs een vruchtwaterpunctie erg moeilijk zou zijn om goed HMW-DNA uit te halen.

  2. Met de momenteel beschikbare sequencing-technologie kun je echter heel vroeg testen, op voorwaarde dat je IVF hebt gebruikt, in ieder geval al in het 100-celstadium (waarschijnlijk eerder). Dit is een betere methode die veel informatie zal missen, maar u voldoende informatie geeft om aneuploïdieën of andere zeer voor de hand liggende varianten te diagnosticeren.

  3. Als alternatief kunt u al in 7 weken (of mogelijk eerder) celvrij foetaal DNA screenen. Het gaat echter niet om het isoleren van cellen, dus het is mogelijk niet waar u aan denkt. Het is iets betere informatie dan pre-implantatiescreening, maar eerder slechtere informatie dan je uit hele cellen kunt halen.

Waarschijnlijk is geen van deze precies het antwoord dat u wilt, maar het is ook een minder eenvoudige vraag dan het op het eerste gezicht lijkt: a) het verkrijgen van cellen is moeilijk en waarschijnlijk niet nodig voor de huidige technologie, en b) de technologie is eigenlijk niet zo goed zoals algemeen geadverteerd.


Embryonale cellen, wanneer kun je ze in vivo detecteren? (Om het hele genoom te sequencen) - Biologie

Menselijke embryonale stamcel (hESC) kan worden afgeleid van een enkele acht-cellige embryoblastomeer.

hESC kan worden afgeleid, uitgebreid en onderhouden in gedefinieerde, xeno-vrije omstandigheden.

De veiligheid, functionaliteit en stabiliteit van hESC-lijnen kunnen experimenteel worden bestudeerd.

Op hESC gebaseerde klinische therapieën voor verschillende aandoeningen zijn aan de gang.

De oprichting van permanente menselijke embryonale stamcellijnen (hESC's) werd voor het eerst gemeld in 1998. Vanwege hun pluripotente karakter en het vermogen om te differentiëren naar alle celtypen in het lichaam, worden ze beschouwd als een celbron voor regeneratieve geneeskunde. Sindsdien is er intensief onderzoek gedaan naar factoren die pluripotentie en differentiatie reguleren. hESC's worden verkregen uit overtollige menselijke IVF-embryo's (in-vitrofertilisatie) die niet kunnen worden gebruikt voor de onvruchtbaarheidsbehandeling van het paar. Tegenwoordig kunnen we deze cellen vestigen en uitbreiden in dierlijke stofvrije omstandigheden, zelfs van afzonderlijke cellen die zijn gebiopteerd uit embryo's in acht-celstadium. Er zijn bevredigende tests voor het aantonen van genetische stabiliteit, afwezigheid van tumorverwekkende mutaties, functionaliteit en veiligheid van hESC's. Er lopen klinische onderzoeken naar leeftijdsgebonden maculaire degeneratie (AMD) en ruggenmergletsel (SCI). Deze review richt zich op de huidige staat van deze technieken.


ChIP-seq wordt voornamelijk gebruikt om te bepalen hoe transcriptiefactoren en andere chromatine-geassocieerde eiwitten fenotype-beïnvloedende mechanismen beïnvloeden. Bepalen hoe eiwitten interageren met DNA om genexpressie te reguleren, is essentieel voor het volledig begrijpen van veel biologische processen en ziektetoestanden. Deze epigenetische informatie is complementair aan de analyse van het genotype en de expressie. ChIP-seq-technologie wordt momenteel voornamelijk gezien als een alternatief voor ChIP-chip waarvoor een hybridisatie-array vereist is. Dit introduceert enige bias, aangezien een array beperkt is tot een vast aantal probes. Van sequencing wordt daarentegen gedacht dat het minder bias heeft, hoewel de sequencing-bias van verschillende sequencing-technologieën nog niet volledig wordt begrepen. [1]

Specifieke DNA-plaatsen in directe fysieke interactie met transcriptiefactoren en andere eiwitten kunnen worden geïsoleerd door chromatine-immunoprecipitatie. ChIP produceert een bibliotheek van doelwit-DNA-sites gebonden aan een eiwit van belang. Massaal parallelle sequentieanalyses worden gebruikt in combinatie met sequentiedatabases van het hele genoom om het interactiepatroon van elk eiwit met DNA, [2] of het patroon van epigenetische chromatine-modificaties te analyseren. Dit kan worden toegepast op de set van ChIP-compatibele eiwitten en modificaties, zoals transcriptiefactoren, polymerasen en transcriptionele machines, structurele eiwitten, eiwitmodificaties en DNA-modificaties. [3] Als alternatief voor de afhankelijkheid van specifieke antilichamen zijn er verschillende methoden ontwikkeld om de superset van alle nucleosoom-verarmde of nucleosoom-verstoorde actieve regulerende regio's in het genoom te vinden, zoals DNase-Seq [4] en FAIRE-Seq. [5] [6]

ChIP Bewerken

ChIP is een krachtige methode om selectief te verrijken voor DNA-sequenties gebonden door een bepaald eiwit in levende cellen. Het wijdverbreide gebruik van deze methode is echter beperkt door het ontbreken van een voldoende robuuste methode om alle verrijkte DNA-sequenties te identificeren. Het ChIP wet lab protocol bevat ChIP en hybridisatie. Er zijn in wezen vijf delen van het ChIP-protocol [7] die helpen om het algehele proces van ChIP beter te begrijpen. Om de ChIP uit te voeren, is de eerste stap verknoping [8] met behulp van formaldehyde en grote partijen DNA om een ​​bruikbare hoeveelheid te verkrijgen. De verknopingen worden gemaakt tussen het eiwit en het DNA, maar ook tussen RNA en andere eiwitten. De tweede stap is het proces van chromatinefragmentatie waarbij het chromatine wordt afgebroken om uiteindelijk hoogwaardige DNA-stukken voor ChIP-analyse te krijgen. Deze fragmenten moeten worden gesneden om elk minder dan 500 basenparen [9] te krijgen om het beste resultaat te krijgen voor het in kaart brengen van het genoom. De derde stap wordt chromatine-immunoprecipitatie genoemd, [7] en dat is waar ChIP een afkorting voor is. Het ChIP-proces verbetert specifieke verknoopte DNA-eiwitcomplexen met behulp van een antilichaam tegen het eiwit van belang, gevolgd door incubatie en centrifugeren om de immunoprecipitatie te verkrijgen. De immunoprecipitatiestap maakt ook de verwijdering van niet-specifieke bindingsplaatsen mogelijk. De vierde stap is DNA-winning en -zuivering, [7] die plaatsvindt door het omgekeerde effect op de cross-link tussen DNA en eiwit om ze te scheiden en DNA te reinigen met een extractie. De vijfde en laatste stap is de analysestap van het ChIP-protocol door het proces van qPCR, ChIP-on-chip (hybride array) of ChIP-sequencing. Oligonucleotide-adapters worden vervolgens toegevoegd aan de kleine stukjes DNA die aan het eiwit van belang waren gebonden om massale parallelle sequencing mogelijk te maken. Door de analyse kunnen de sequenties vervolgens worden geïdentificeerd en geïnterpreteerd door het gen of de regio waaraan het eiwit was gebonden. [7]

Sequentie bewerken

Na grootteselectie worden alle resulterende ChIP-DNA-fragmenten gelijktijdig gesequenced met behulp van een genoomsequencer. Een enkele sequencing-run kan zoeken naar genoombrede associaties met een hoge resolutie, wat betekent dat functies precies op de chromosomen kunnen worden gelokaliseerd. ChIP-chip daarentegen vereist grote sets tegelarrays voor een lagere resolutie. [10]

Er zijn veel nieuwe sequencing-methoden gebruikt in deze sequencing-stap. Sommige technologieën die de sequenties analyseren, kunnen clusteramplificatie van adapter-geligeerde ChIP-DNA-fragmenten op een solide stroomcelsubstraat gebruiken om clusters van elk ongeveer 1000 klonale kopieën te maken. De resulterende array van sjabloonclusters met hoge dichtheid op het oppervlak van de stroomcel wordt gesequenced door een genoomanalyseprogramma. Elk sjablooncluster ondergaat parallel sequentie-door-synthese met behulp van nieuwe fluorescent gelabelde omkeerbare terminator-nucleotiden. Sjablonen worden tijdens elke lezing base-by-base gesequenced. Vervolgens lijnt de software voor het verzamelen en analyseren van gegevens de monstersequenties uit op een bekende genomische sequentie om de ChIP-DNA-fragmenten te identificeren. [ citaat nodig ]

ChIP-seq biedt ons een snelle analyse, maar er moet een kwaliteitscontrole worden uitgevoerd om ervoor te zorgen dat de verkregen resultaten betrouwbaar zijn:

  • Niet-redundante fractie: regio's met een lage complexiteit moeten worden verwijderd omdat ze niet informatief zijn en kunnen interfereren met het in kaart brengen in het referentiegenoom. [11]
  • Fragmenten in pieken: verhouding van uitlezingen die zich in pieken bevinden ten opzichte van uitlezingen die zich bevinden waar geen piek is. [11]

De gevoeligheid van deze technologie hangt af van de diepte van de sequencing-run (d.w.z. het aantal in kaart gebrachte sequentietags), de grootte van het genoom en de verdeling van de doelfactor. De sequencing diepte is direct gecorreleerd met de kosten. Als overvloedige bindmiddelen in grote genomen met hoge gevoeligheid in kaart moeten worden gebracht, zijn de kosten hoog omdat er een enorm groot aantal sequentietags nodig zal zijn. Dit in tegenstelling tot ChIP-chip waarbij de kosten niet gecorreleerd zijn met gevoeligheid. [12] [13]

In tegenstelling tot op microarray gebaseerde ChIP-methoden, wordt de precisie van de ChIP-seq-assay niet beperkt door de afstand tussen vooraf bepaalde sondes. Door een groot aantal korte uitlezingen te integreren, wordt een zeer nauwkeurige lokalisatie van de bindingsplaats verkregen. In vergelijking met ChIP-chip kunnen ChIP-seq-gegevens worden gebruikt om de bindingsplaats binnen enkele tientallen basenparen van de eigenlijke eiwitbindingsplaats te lokaliseren. Tag-dichtheden op de bindingsplaatsen zijn een goede indicator van eiwit-DNA-bindingsaffiniteit [14], wat het gemakkelijker maakt om bindingsaffiniteiten van een eiwit met verschillende DNA-plaatsen te kwantificeren en te vergelijken. [15]

STAT1 DNA-associatie: ChIP-seq werd gebruikt om STAT1-doelen in HeLa S3-cellen te bestuderen die klonen zijn van de HeLa-lijn die worden gebruikt voor analyse van celpopulaties. [16] De prestaties van ChIP-seq werden vervolgens vergeleken met de alternatieve eiwit-DNA-interactiemethoden van ChIP-PCR en ChIP-chip. [17]

Nucleosoomarchitectuur van promotors: Met behulp van ChIP-seq werd vastgesteld dat gistgenen een minimaal nucleosoomvrij promotorgebied van 150 bp lijken te hebben waarin RNA-polymerase transcriptie kan initiëren. [18]

Transcriptiefactor behoud: ChIP-seq werd gebruikt om het behoud van TF's in de voorhersenen en het hartweefsel bij embryonale muizen te vergelijken. De auteurs identificeerden en valideerden de hartfunctionaliteit van transcriptieversterkers en stelden vast dat transcriptieversterkers voor het hart minder geconserveerd zijn dan die voor de voorhersenen tijdens hetzelfde ontwikkelingsstadium. [19]

Genoombrede ChIP-seq: ChIP-sequencing werd voltooid op de worm C. elegans om genoombrede bindingsplaatsen van 22 transcriptiefactoren te onderzoeken. Tot 20% van de geannoteerde kandidaatgenen werden toegewezen aan transcriptiefactoren. Verschillende transcriptiefactoren werden toegewezen aan niet-coderende RNA-regio's en kunnen onderhevig zijn aan ontwikkelings- of omgevingsvariabelen. De functies van enkele van de transcriptiefactoren werden ook geïdentificeerd. Sommige van de transcriptiefactoren reguleren genen die andere transcriptiefactoren controleren. Deze genen worden niet gereguleerd door andere factoren. De meeste transcriptiefactoren dienen als zowel doelwitten als regulatoren van andere factoren, wat een netwerk van regulering aantoont. [20]

Afleidend regelgevend netwerk: ChIP-seq-signaal van Histon-modificatie bleek meer gecorreleerd te zijn met transcriptiefactormotieven op promoters in vergelijking met RNA-niveau. [21] Daarom stelde de auteur voor dat het gebruik van histon-modificatie ChIP-seq een betrouwbaardere inferentie van genregulerende netwerken zou opleveren in vergelijking met andere methoden op basis van expressie.

ChIP-seq biedt een alternatief voor ChIP-chip. STAT1 experimentele ChIP-seq-gegevens hebben een hoge mate van gelijkenis met resultaten die zijn verkregen door ChIP-chip voor hetzelfde type experiment, met meer dan 64% van de pieken in gedeelde genomische regio's. Omdat de gegevens sequentielezingen zijn, biedt ChIP-seq een snelle analysepijplijn zolang er een hoogwaardige genoomsequentie beschikbaar is voor leestoewijzing en het genoom geen repetitieve inhoud heeft die het mappingproces verwart. ChIP-seq heeft ook het potentieel om mutaties in sequenties van bindingsplaatsen te detecteren, wat direct alle waargenomen veranderingen in eiwitbinding en genregulatie kan ondersteunen.

Zoals met veel high-throughput sequencing-benaderingen, genereert ChIP-seq extreem grote datasets, waarvoor geschikte computationele analysemethoden vereist zijn. Om DNA-bindingsplaatsen van ChIP-seq-leestellingsgegevens te voorspellen, zijn piekbelmethoden ontwikkeld. Een van de meest populaire methoden [ citaat nodig ] is MACS dat empirisch de verschuivingsgrootte van ChIP-Seq-tags modelleert en deze gebruikt om de ruimtelijke resolutie van voorspelde bindingsplaatsen te verbeteren. [22] MACS is geoptimaliseerd voor pieken met een hogere resolutie, terwijl een ander populair algoritme, SICER, is geprogrammeerd om bredere pieken op te roepen, variërend van kilobasen tot megabasen om te zoeken naar bredere chromatinedomeinen. SICER is nuttiger voor histonmarkeringen die genlichamen overspannen. Een mathematisch meer rigoureuze methode BCP (Bayesian Change Point) kan worden gebruikt voor zowel scherpe als brede pieken met een hogere rekensnelheid, [23] zie benchmarkvergelijking van ChIP-seq peak-calling-tools door Thomas et. al. (2017). [24]

Een ander relevant computationeel probleem is differentiële piekoproep, die significante verschillen identificeert in twee ChIP-seq-signalen van verschillende biologische omstandigheden. Differentiële piekbellers segmenteren twee ChIP-seq-signalen en identificeren differentiële pieken met behulp van verborgen Markov-modellen. Voorbeelden voor tweetraps differentiële piekbellers zijn ChIPDiff [25] en ODIN. [26]

Om valse sites van ChIP-seq te verminderen, kunnen meerdere experimentele controles worden gebruikt om bindingsplaatsen van een IP-experiment te detecteren. Bay2Ctrls gebruikt een Bayesiaans model om de DNA-invoercontrole voor het IP, de nep-IP en de bijbehorende DNA-invoercontrole te integreren om bindingsplaatsen van het IP te voorspellen. [27] Deze aanpak is vooral effectief voor complexe monsters zoals hele modelorganismen. Bovendien geeft de analyse aan dat voor complexe monsters nep-IP-controles aanzienlijk beter presteren dan DNA-invoercontroles, waarschijnlijk vanwege de actieve genomen van de monsters. [27]


Download en print dit artikel voor uw persoonlijke wetenschappelijke, onderzoeks- en educatieve doeleinden.

Koop een los nummer van Wetenschap voor slechts $ 15 USD.

Wetenschap

Vol 300, uitgave 5623
23 mei 2003

Artikel Gereedschap

Log in om een ​​waarschuwing voor dit artikel toe te voegen.

Door Karin Hübner, Guy Fuhrmann, Lane K. Christenson, James Kehler, Rolland Reinbold, Rabindranath De La Fuente, Jennifer Wood, Jerome F. Strauss III, Michele Boiani, Hans R. Schöler

Wetenschap 23 mei 2003 : 1251-1256


State-of-the-art analysetechnieken

Kwaliteitscontrole

Na demultiplexing van streepjescodes en uitlijning van geschikt getrimde uitlezingen op het juiste referentiegenoom, kunnen de resulterende gegevens van een scRNA-seq-experiment worden weergegeven als een geheeltallige matrix van genexpressieniveaus, waarbij elke invoer het aantal sequentiele uitlezingen (of moleculen, indien UMI's werden gebruikt) toegewezen aan een bepaald gen in een specifieke cel. Met name de ontleding van streepjescodes is niet triviaal, vooral niet voor de willekeurige reeksen van UMI's, omdat fouten in de volgorde de waargenomen reeksen kunnen veranderen. Er zijn methoden ontwikkeld om hier rekening mee te houden door te voorspellen welke barcodes door een fout zijn ontstaan ​​​​en die echt in het monster bestonden (Smith et al, 2017 ).

Vervolgens is het belangrijk om de kwaliteit van het transcriptoom voor elke cel te beoordelen: onvolledige cellysis of storingen tijdens de voorbereiding van de bibliotheek kunnen output opleveren die analyses verwart. Er zijn veel parameters waarop kwaliteitscontroletests (QC) zich kunnen richten, maar er zijn drie kenmerken die gemakkelijk kunnen worden beoordeeld in alle eencellige datasets: het totale aantal gedetecteerde transcripten het totale aantal genen dat tot expressie wordt gebracht en de fractie van expressie bijgedragen door mitochondriale genen. Cellen die afwijkend gedrag vertonen voor deze kenmerken worden doorgaans verwijderd uit verdere analyse, hoewel voorzichtigheid geboden is bij het bestuderen van een heterogene celpopulatie aangezien het totale mRNA-gehalte en andere kenmerken aanzienlijk kunnen variëren (Ilicic et al, 2016 ).

Drop-out is een fenomeen dat wordt waargenomen in scRNA-seq, waarbij cellen waarvan wordt verwacht dat ze een bepaald gen tot expressie brengen, een waargenomen telling van nul vertonen. Dit wordt meestal veroorzaakt door stochastische mislukkingen van transcripten om omgekeerd te worden getranscribeerd of geamplificeerd, en daarom nooit de sequentie te bepalen. Dit is van bijzonder belang voor gegevens die worden gegenereerd door druppeltesten, waarbij de efficiëntie van de opname aanzienlijk varieert tussen cellen. Om expressiewaarden van uitgevallen genen te herstellen, is het mogelijk expressiewaarden toe te rekenen van andere cellen die vergelijkbare expressiepatronen vertonen (preprint: Dijk et al, 2017 ). De gebruiker moet er echter voor zorgen dat zwakke signalen niet kunstmatig worden opgeblazen. Een onderzoeker moet zich ook bewust zijn van de mogelijkheid dat doubletten een technisch signaal in een dataset kunnen aansturen, met name voor op druppels gebaseerde methoden. Hoewel er op het moment van schrijven geen gepubliceerde methoden voor doubletdetectie zijn, hebben een aantal artikelen heuristische benaderingen geïmplementeerd voor het uitsluiten van multipletbibliotheken. Deze omvatten het afwijzen van cellen die sets van biologisch elkaar uitsluitende markers tot expressie brengen (bijv. Xist en Y-chromosoomgenen Ibarra-Soria et al, 2017), en door kleine clusters te identificeren die zijn samengesteld uit cellen met een grote bibliotheekomvang waarvan de expressieprofielen sterk correleren met ten minste twee andere clusters in de dataset (Bach et al, 2017 ).

Verstorende factoren

Eencellige RNA-seq-experimenten zijn gevoelig voor verstorende factoren. Zoals in elk -omics-experiment, moeten bijvoorbeeld systematische verschillen tussen experimentele batches worden verwijderd voordat de expressieprofielen van cellen kunnen worden vergeleken, wat het belang van een goed experimenteel ontwerp benadrukt (Lun & Marioni, 2017). Zelfs wanneer voor deze effecten wordt gecontroleerd, kunnen echte biologische verschillen signalen produceren die loodrecht op het doel van het experiment staan. Met name de celgrootte (zoals weerspiegeld door het totale mRNA-gehalte) manifesteert zich vaak in het aantal gedetecteerde genen in elke cel (McDavid et al, 2016 Hicks et al, 2017), wat kan leiden tot structuur in de hoogdimensionale expressieruimte. Verschillen in grootte van celbibliotheken worden gecontroleerd door de kritische stap van normalisatie (beoordeeld in Vallejos et al (2017)), die tot doel heeft verschillen als gevolg van sequentiediepte en totaal RNA-gehalte te verwijderen. De toevoeging van nauwkeurig gekwantificeerde exogene RNA-soorten (“spike-in”-genen) aan het lysaat van elke cel maakt de schatting van absolute hoeveelheden RNA (Brennecke et al, 2013 ). Het gebruik ervan is echter zeldzaam in op druppeltjes gebaseerde testen: spike-in-RNA zal in elke druppel aanwezig zijn, niet alleen die met cellen. Bijgevolg kunnen spike-in-genen een grote hoeveelheid van de sequencing-leesruimte in beslag nemen en zouden ze in de war raken door herhaald gebruik van dezelfde celbarcode in meerdere druppels (resulterend in een variabele hoeveelheid spike per barcode). Andere biologische factoren, zoals het celcyclusstadium, kunnen ook leiden tot een structuur die het van belang zijnde signaal kan maskeren. Er bestaan ​​rekenstrategieën om deze effecten te identificeren en te verwijderen (Buettner et al, 2015 ).

Identificatie van celtype

Een veelvoorkomende eerste stap bij de analyse van scRNA-seq-gegevens is het classificeren van cellen in een aantal groepen. Door deze subgroepen van cellen te identificeren, kan de mate van heterogeniteit binnen de populatie van belang worden beoordeeld en kunnen vergelijkingen worden uitgevoerd, zelfs tussen potentieel kleine of zeldzame groepen cellen (bijv. primordiale kiemcellen).

De prestaties van celtypeclustering kunnen worden verbeterd door alleen genen te gebruiken die meer verschillen tussen cellen dan op basis van toeval zou worden verwacht (Brennecke et al, 2013), of door "eigengenen" te gebruiken die de variabiliteit in de gegevens verklaren (bijvoorbeeld afgeleid via principale componentenanalyse). Zie Trapnell (2015) voor een aanvullende bespreking van deze functies.

Ontwikkelingstrajecten en pseudotijd

In veel systemen vertonen cellen een continu spectrum van toestanden waarvan wordt aangenomen dat ze het differentiatieproces vertegenwoordigen. In deze gevallen is een discrete classificatie van cellen niet geschikt en kan een onderzoeker er de voorkeur aan geven een methode te gebruiken die de continuïteit van celtoestanden in de gegevens samenvat.

Dergelijke methoden worden meestal aangeduid als: pseudotijd methoden, een term die voor het eerst werd geïntroduceerd door het softwarepakket Monocle (Trapnell et al, 2014 ). Pseudotime beschrijft een ordening van cellen volgens een kenmerk in de gegevens. Dit kan ontwikkelingsprocessen vertegenwoordigen die in de loop van de tijd plaatsvinden, of de effecten van continue ruimtelijke heterogeniteit in een systeem. Omdat pseudotijd een ordening van cellen is, maakt het identificatie mogelijk van de celtypen in de begin- en eindtoestanden van het traject, evenals die cellen in tussenstadia (figuur 2). Aan de hand van de volgorde van cellen is het mogelijk om de transcriptionele veranderingen te identificeren die gepaard gaan met ontwikkelingsprocessen, wat ook de reconstructie van genregulerende netwerken mogelijk maakt (Moignard et al, 2015 ). Bovendien maken recente ontwikkelingen het mogelijk om vertakkingspunten in trajecten te detecteren (Haghverdi et al, 2016), die dienen om kritieke punten van cellulaire besluitvorming te identificeren. Merk op dat voorzichtigheid moet worden betracht bij het toepassen van classificatie- en pseudotijdmethoden, aangezien deze gegarandeerd output genereren, ongeacht de kwaliteit van de aangeleverde gegevens. Er is zelden een kwantificering van onzekerheid, en de resultaten zijn meestal afhankelijk van specifieke parameterkeuzes. Voor een goede interpretatie is het belangrijk ervoor te zorgen dat de invoergegevens van hoge kwaliteit zijn en niet worden vertroebeld door bijvoorbeeld batcheffecten. Bovendien moet worden benadrukt dat de statische "snapshot" -gegevens van scRNA-seq intrinsieke beperkingen hebben voor de studie van dynamische processen, die gebruikelijk zijn in de ontwikkelingsbiologie (preprint: Weinreb et al, 2017 ).

Figuur 2. Pseudotime recapituleert ontwikkelingstrajecten


Embryonale stamcel

Embryonale stamcellen (ESC's) zijn stamcellen die zijn afgeleid van de ongedifferentieerde binnenste massacellen van een menselijk embryo.

Embryonale stamcellen zijn pluripotent, wat betekent dat ze kunnen groeien (d.w.z. differentiëren) tot alle derivaten van de drie primaire kiemlagen: ectoderm, endoderm en mesoderm.

Met andere woorden, ze kunnen zich ontwikkelen tot elk van de meer dan 200 celtypen van het volwassen lichaam, zolang ze daarvoor zijn gespecificeerd.

Embryonale stamcellen onderscheiden zich door twee onderscheidende eigenschappen: hun pluripotentie en hun vermogen om voor onbepaalde tijd te repliceren.

ES-cellen zijn pluripotent, dat wil zeggen dat ze kunnen differentiëren in alle derivaten van de drie primaire kiemlagen: ectoderm, endoderm en mesoderm.

Deze omvatten elk van de meer dan 220 celtypen in het volwassen lichaam.

Pluripotentie onderscheidt embryonale stamcellen van volwassen stamcellen die bij volwassenen worden gevonden, terwijl embryonale stamcellen alle celtypen in het lichaam kunnen genereren, volwassen stamcellen zijn multipotent en kunnen slechts een beperkt aantal celtypen produceren.

Bovendien zijn embryonale stamcellen onder gedefinieerde omstandigheden in staat zichzelf voor onbepaalde tijd te vermeerderen.

Hierdoor kunnen embryonale stamcellen worden gebruikt als nuttige hulpmiddelen voor zowel onderzoek als regeneratieve geneeskunde, omdat ze een onbeperkt aantal van zichzelf kunnen produceren voor voortgezet onderzoek of klinisch gebruik.

Vanwege hun plasticiteit en potentieel onbeperkt vermogen tot zelfvernieuwing, zijn ES-celtherapieën voorgesteld voor regeneratieve geneeskunde en weefselvervanging na verwonding of ziekte.

Ziekten die mogelijk kunnen worden behandeld door pluripotente stamcellen omvatten een aantal bloed- en immuunsysteemgerelateerde genetische ziekten, kankers en aandoeningen jeugddiabetes

Parkinson blindheid en ruggenmergletsels.

Naast de ethische bezwaren van stamceltherapie is er een technisch probleem van graft-versus-host-ziekte geassocieerd met allogene stamceltransplantatie.

Deze problemen in verband met histocompatibiliteit kunnen echter worden opgelost met behulp van volwassen autologe donorstamcellen, therapeutisch klonen, stamcelbanken of meer recentelijk door herprogrammering van somatische cellen met gedefinieerde factoren (bijv. geïnduceerde pluripotente stamcellen).

Andere mogelijke toepassingen van embryonale stamcellen zijn onder meer onderzoek naar vroege menselijke ontwikkeling, onderzoek naar genetische ziekten en als in vitro-systemen voor toxicologische tests.


Vroege embryonale hematopoëse buiten de AGM-regio

Placenta: een bron of reservoir?

Hoewel bekend is dat de foetale placenta dHSC's herbergt (Dancis et al., 1977 Dancis et al., 1968), verhulde de mogelijkheid dat de placenta wordt gekoloniseerd door HSC's uit de foetale lever de betekenis van deze bevinding. Het chorionische deel van de placenta van de muis drukt Runx1 vanaf een vroeg ontwikkelingsstadium (Fig. 1A), en wanneer geïsoleerd voorafgaand aan fusie met de allantois hematopoëtische cellen in kweek kunnen genereren (Zeigler et al., 2006). E8.0-9.0 muizenplacenta bevat veel hematopoëtische voorlopers, waaronder herplateerbare HPP-CFC (zie Woordenlijst, Box 1) (Alvarez-Silva et al., 2003). Zoals blijkt uit transplantatie, verschijnen dHSC's in de placenta gelijktijdig met het AGM-gebied door E10.5-11.0 (Gekas et al., 2005 Ottersbach en Dzierzak, 2005). Parallel met AGM-activiteit ontwikkelt de placenta snel een substantiële dHSC-pool (13-50 dHSC tegen E12.5), die afneemt met E15.5, wat suggereert dat dHSC's zich verplaatsen naar de lever (Gekas et al., 2005 Ottersbach en Dzierzak, 2005). De menselijke placenta is ook een niche voor dHSC's (Robin et al., 2009).

De hematopoëse van de zebravis vindt plaats in vier opeenvolgende golven. (EEN) Een 14 uur na bevruchting (hpf) zebravisembryo, van bovenaf gezien (links) en in dwarsdoorsnede (rechts), met laterale strepen van het posterieure laterale mesoderm (PLM) die de dorsale aorta, kardinale ader, bloedcellen en de vatbaarphros en zijn kanalen na zijn migratie naar de middellijn. De gebogen pijlen tonen de twee PLM-strepen die naar de middellijn migreren. (B) Een 18 hpf zebravisembryo, gezien vanaf de zijkant met dorsale bovenkant (links) en in dwarsdoorsnede (rechts). In dit stadium migreert de golf van myeloïde (pu.1 + /Scl +)-precursoren, die hun oorsprong vinden in het voorste laterale mesoderm, lateraal over de dooierzak en rijpen ze in macrofagen en granulocyten (zie golf 1, W1). De migratie van de PLM-strepen naar de middellijn (zoals aangegeven door twee zwarte convergerende pijlen in B, rechts) resulteert in de differentiatie van embryonale erytroïde cellen (aangegeven in lichtoranje schakering) onder het dorsale aorta-angioblastkoord (getoond in roze) in golf 2 (W2). (C) Een 26 hpf zebravisembryo met een dwarsdoorsnede aan de rechterkant. In dit stadium verschijnen erythromyeloïde voorlopers die geen lymfoïde differentiatiepotentieel hebben in het caudale hematopoëtische weefsel (ook posterieur bloedeiland en caudale veneuze plexus genoemd). Deze voorlopers koloniseren de sensitivephros maar niet de thymus (golf 3, W3). W3 wordt gevolgd door het verschijnen van MPP/HSC's uit de bodem van de dorsale aorta (golf 4, W4). MPP- en HSC-vorming vindt plaats via een proces dat endotheel-hematopoëtische overgang wordt genoemd: de langwerpige endotheelcel (groen gemarkeerd) begint Runx1, c-Myb, CD41 tot expressie te brengen, buigt en wordt rond. Vervolgens migreert het door de mesenchymale laag en komt het in de kardinale ader (dunne gebogen pijl). Door de circulatie koloniseren HSC's organen van volwassen hematopoëtische activiteit (pronephros en thymus), weergegeven door rechte, vette pijlen. De circulatierichting wordt aangegeven door dunne pijlen in vaten. HSC, hematopoëtische stamcel MPP, multipotente progenitor.

De hematopoëse van de zebravis vindt plaats in vier opeenvolgende golven. (EEN) Een 14 uur na bevruchting (hpf) zebravisembryo, van bovenaf gezien (links) en in dwarsdoorsnede (rechts), met laterale strepen van het posterieure laterale mesoderm (PLM) die de dorsale aorta, kardinale ader, bloedcellen en de sensitivephros en zijn kanalen na de migratie naar de middellijn. De gebogen pijlen tonen de twee PLM-strepen die naar de middellijn migreren. (B) Een zebravisembryo van 18 pk, gezien vanaf de zijkant met de dorsale bovenkant (links) en in dwarsdoorsnede (rechts). In dit stadium migreert de golf van myeloïde (pu.1+/Scl+)-precursoren, die hun oorsprong vinden in het voorste laterale mesoderm, lateraal over de dooierzak en rijpen ze uit tot macrofagen en granulocyten (zie golf 1, W1). De migratie van de PLM-strepen naar de middellijn (zoals aangegeven door twee zwarte convergerende pijlen in B, rechts) resulteert in de differentiatie van embryonale erytroïde cellen (aangegeven in lichtoranje schakering) onder het dorsale aorta-angioblastkoord (getoond in roze) in golf 2 (W2). (C) Een 26 hpf zebravisembryo met een dwarsdoorsnede aan de rechterkant. In dit stadium verschijnen erythromyeloïde voorlopers die geen lymfoïde differentiatiepotentieel hebben in het caudale hematopoëtische weefsel (ook posterieur bloedeiland en caudale veneuze plexus genoemd). Deze voorlopers koloniseren de sensitivephros maar niet de thymus (golf 3, W3). W3 wordt gevolgd door het verschijnen van MPP/HSC's uit de bodem van de dorsale aorta (golf 4, W4). MPP- en HSC-vorming vindt plaats via een proces dat endotheel-hematopoëtische overgang wordt genoemd: de langwerpige endotheelcel (groen gemarkeerd) begint Runx1, c-Myb, CD41 tot expressie te brengen, buigt en wordt rond. Vervolgens migreert het door de mesenchymale laag en komt het in de kardinale ader (dunne gebogen pijl). Door de bloedsomloop koloniseren HSC's organen van volwassen hematopoëtische activiteit (pronephros en thymus), weergegeven door rechte dikke pijlen. De circulatierichting wordt aangegeven door dunne pijlen in vaten. HSC, hematopoëtische stamcel MPP, multipotente progenitor.

In de placenta van de Ncx1-null muis (Ncx1 codeert voor een natrium-calcium-uitwisselingsmembraan, ook bekend als Slc8a1 – Mouse Genome Informatics) een actieve bloedsomloop ontbreekt als gevolg van een falende hartslag. Er worden echter nog steeds hematopoëtische celclusters gevormd die vergelijkbaar zijn met intra-aortische clusters, en er werd voorgesteld dat de placenta autonoom dHSC's genereert (Rhodes et al., 2008). Ncx1 −/−-placenta's kunnen lymfoïde cellen genereren, maar pogingen om de autonome generatie van dHSC's in explantculturen van de wildtype placenta te bevestigen, zijn niet succesvol geweest (Robin et al., 2006). Of de placenta de ontwikkeling van dHSC initieert of alleen de rijping van exogene dHSC's ondersteunt, vereist nader onderzoek.

Navelstreng: wat is het dHSC-vermogen?

De navelstreng van zoogdieren is grotendeels afkomstig van de allantois, die, nadat gastrulatie de exocoelomische holte binnendringt, de ectoplacentale kegel bereikt en de chorio-allantoïsche fusie vormt die bijdraagt ​​​​aan de placenta (Downs, 2002). Although the avian allantois is hematopoietically active (Caprioli et al., 1998), whether the mouse allantois is has been questioned (Downs et al., 1998). However, Runx1 was detected in the mouse allantois prior to fusion with the ectoplacental cone (Fig. 1A) and its hematopoietic potential was unveiled in culture (Corbel et al., 2007 Zeigler et al., 2006).

The mouse umbilical vessels develop Runx1-positive cell clusters similar to those observed in the dorsal aorta (Liakhovitskaia et al., 2009 North et al., 1999), and at E10.5 contain rare dHSC at frequencies comparable with the AGM region at this stage (

1 dHSC per 30 embryos) (de Bruijn et al., 2000b). As explant cultures of the umbilical cord fail to generate dHSC, the contribution of the allantois/umbilical cord to adult hematopoiesis remains unknown.

DHSC generation: does the yolk sac have an active role?

E9.0-10.0 yolk sac cells can mature into dHSCs in newborn animals and can subsequently provide long-term contribution to adult hematopoiesis (Yoder et al., 1997a Yoder et al., 1997b). Similar results have been achieved by the transplantation of E9.0 yolk sac cells into the embryo in utero (Toles et al., 1989). These cells are more numerous in the yolk sac than in the body and are CD34 + cKit + (Yoder et al., 1997a). CD34 + cKit + cells purified from the E10.5 AGM region can develop in culture into cells that can repopulate adult Rag2γc −/− at low levels (Bertrandet et al., 2005). What is the origin of these cells: the P-Sp or the yolk sac? The answer to this is not clear as these cells are not functionally detectable in younger E8.0 embryos. Earlier reports indicated that E8.0 yolk sac cells when injected transplacentally can mature and contribute to adult hematopoiesis (Weissman et al., 1977). However, the primary origin of these cells (yolk sac or P-Sp) remains unclear. An attempt to determine the contribution of the yolk sac to adult hematopoiesis has been made using induced genetic labeling of Runx1 + cells (Samokhvalov et al., 2007). However, owing to the unclear duration of labeling, the presence of Runx1-expressing cells outside of the yolk sac and the very low contribution of labeled cells to adult hematopoiesis, it is difficult to draw firm conclusions from this study.

Possible mechanisms of intra-aortic cluster formation. (EEN) A dissected E11.5 mouse AGM region, showing the dorsal aorta (Ao) and urogenital ridges (UGR). (B) Transverse section of E11.5 AGM region, showing the Ao and an intra-aortic cluster that is triple-positive for Pecam-1, CD45 and c-kit (magnified in the insert). Note the indentation (arrow), which suggests that active invagination of the endothelial layer is associated with cluster formation. Asterisk indicates intra-aortic cluster. CV, caudal vein. (C) A schematic cross-section of the ventral floor of a mouse Ao showing four possible origins of dHSCs. (een) An endothelial precursor gives rise to endothelial cells (blue), some of which become hematogenic and give rise to the definitive hematopoietic stem cells (dHSCs, pink) and more differentiated hematopoietic cells. A Pre-dHSC intermediate (purple) between the hematogenic endothelial cell and dHSC is shown integrated into the endothelial layer. (B) A hemangioblast (purple) gives rise separately to the dHSC and to non-hematopoietic (structural) endothelial cells. A pre-HSC intermediate may be integrated into the endothelial lining but in fact is not an endothelial cell. (C) Sub-endothelial pre-dHSC of non-endothelial origin matures into a dHSC. It is a fully hematopoietically committed cell and, in contrast to hemangioblasts, pre-HSCs do not generate endothelial cells. (NS) A migrant pre-dHSC of non-endothelial origin arrives through circulation and integrates into the endothelial lining.

Possible mechanisms of intra-aortic cluster formation. (EEN) A dissected E11.5 mouse AGM region, showing the dorsal aorta (Ao) and urogenital ridges (UGR). (B) Transverse section of E11.5 AGM region, showing the Ao and an intra-aortic cluster that is triple-positive for Pecam-1, CD45 and c-kit (magnified in the insert). Note the indentation (arrow), which suggests that active invagination of the endothelial layer is associated with cluster formation. Asterisk indicates intra-aortic cluster. CV, caudal vein. (C) A schematic cross-section of the ventral floor of a mouse Ao showing four possible origins of dHSCs. (een) An endothelial precursor gives rise to endothelial cells (blue), some of which become hematogenic and give rise to the definitive hematopoietic stem cells (dHSCs, pink) and more differentiated hematopoietic cells. A Pre-dHSC intermediate (purple) between the hematogenic endothelial cell and dHSC is shown integrated into the endothelial layer. (B) A hemangioblast (purple) gives rise separately to the dHSC and to non-hematopoietic (structural) endothelial cells. A pre-HSC intermediate may be integrated into the endothelial lining but in fact is not an endothelial cell. (C) Sub-endothelial pre-dHSC of non-endothelial origin matures into a dHSC. It is a fully hematopoietically committed cell and, in contrast to hemangioblasts, pre-HSCs do not generate endothelial cells. (NS) A migrant pre-dHSC of non-endothelial origin arrives through circulation and integrates into the endothelial lining.

Although the pre-circulatory E8.0 mouse yolk sac is restricted to generating short-lived myeloid progeny (Cumano et al., 2001), by E11.5 it contains true multilineage dHSCs. Furthermore, by E12.5, when the expansion of dHSCs in the AGM has significantly diminished, the yolk sac acquires the capacity to expand dHSCs in culture (Kumaravelu et al., 2002). Although it is possible that the E12.5 yolk sac microenvironment becomes competent to expand dHSCs of exogenous origins, the initiation of dHSCs de novo by the yolk sac cannot be ruled out. dHSCs in heterozygous Runx1 +/− embryos develop prematurely in the yolk sac by E10.5, indicating that this location, in principle, is not prohibitive for dHSC development (Cai et al., 2000).

Different sites of hematopoietic activity in the embryo are linked by the circulation, but is the role of the circulation in hematopoiesis only to facilitate cell trafficking? We discuss this further below.


IPSCs

Although pluripotency can occur naturally only in embryonic stem cells, it is possible to induce terminally differentiated cells to become pluripotent again. The process of direct reprogramming converts differentiated somatic cells into iPSC lines that can form all cell types of an organism. Reprogramming focuses on the expression of oncogenes such as Myc and Klf4 (Kruppel-like factor 4). This process is enhanced by a downregulation of genes promoting genome stability, such as p53. Additionally, cell reprogramming involves histone alteration. All these processes can cause potential mutagenic risk and later lead to an increased number of mutations. Quinlan et al. [40] checked fully pluripotent mouse iPSCs using whole genome DNA sequencing and structural variation (SV) detection algorithms. Based on those studies, it was confirmed that although there were single mutations in the non-genetic region, there were non-retrotransposon insertions. This led to the conclusion that current reprogramming methods can produce fully pluripotent iPSCs without severe genomic alterations.

During the course of development from pluripotent hESCs to differentiated somatic cells, crucial changes appear in the epigenetic structure of these cells. There is a restriction or permission of the transcription of genes relevant to each cell type. When somatic cells are being reprogrammed using transcription factors, all the epigenetic architecture has to be reconditioned to achieve iPSCs with pluripotency [41]. However, cells of each tissue undergo specific somatic genomic methylation. This influences transcription, which can further cause alterations in induced pluripotency [42].

Source of iPSCs

Because pluripotent cells can propagate indefinitely and differentiate into any kind of cell, they can be an unlimited source, either for replacing lost or diseased tissues. iPSCs bypass the need for embryos in stem cell therapy. Because they are made from the patient’s own cells, they are autologous and no longer generate any risk of immune rejection.

At first, fibroblasts were used as a source of iPSCs. Because a biopsy was needed to achieve these types of cells, the technique underwent further research. Researchers investigated whether more accessible cells could be used in the method. Further, other cells were used in the process: peripheral blood cells, keratinocytes, and renal epithelial cells found in urine. An alternative strategy to stem cell transplantation can be stimulating a patient’s endogenous stem cells to divide or differentiate, occurring naturally when skin wounds are healing. In 2008, pancreatic exocrine cells were shown to be reprogrammed to functional, insulin-producing beta cells [43].

The best stem cell source appears to be the fibroblasts, which is more tempting in the case of logistics since its stimulation can be fast and better controlled [44].

Teratoma formation assay

The self-renewal and differentiation capabilities of iPSCs have gained significant interest and attention in regenerative medicine sciences. To study their abilities, a quality-control assay is needed, of which one of the most important is the teratoma formation assay. Teratomas are benign tumours. Teratomas are capable of rapid growth in vivo and are characteristic because of their ability to develop into tissues of all three germ layers simultaneously. Because of the high pluripotency of teratomas, this formation assay is considered an assessment of iPSC’s abilities [45].

Teratoma formation rate, for instance, was observed to be elevated in human iPSCs compared to that in hESCs [46]. This difference may be connected to different differentiation methods and cell origins. Most commonly, the teratoma assay involves an injection of examined iPSCs subcutaneously or under the testis or kidney capsule in mice, which are immune-deficient [47]. After injection, an immature but recognizable tissue can be observed, such as the kidney tubules, bone, cartilage, or neuroepithelium [30]. The injection site may have an impact on the efficiency of teratoma formation [48].

There are three groups of markers used in this assay to differentiate the cells of germ layers. For endodermal tissue, there is insulin/C-peptide and alpha-1 antitrypsin [49]. For the mesoderm, derivatives can be used, e.g. cartilage matrix protein for the bone and alcian blue for the cartilage. As ectodermal markers, class III B botulin or keratin can be used for keratinocytes.

Teratoma formation assays are considered the gold standard for demonstrating the pluripotency of human iPSCs, demonstrating their possibilities under physiological conditions. Due to their actual tissue formation, they could be used for the characterization of many cell lineages [50].


Methoden:

Oversight.

Animals.

All procedures with mice followed the recommendations and approval of the Institutional Animal Care and Use Committee of the University of Washington and were performed within an American Association for the Advancement of Laboratory Animal Care-accredited specific pathogen-free facility at the University of Washington.

Human subjects.

Approval was received from the University of Washington Institutional Review Board to obtain consent for donation of excess cryopreserved human embryos from fertility clinic patients to generate new human ESC lines. All embryo donations followed informed consent.

Embryonic stem cell research oversight.

All embryonic stem cell work was preapproved by the University of Washington Embryonic Stem Cell Research Oversight Committee.

Cell Line Nomenclature.

Cell line name “p” + number: total passage number

L: leukemia inhibitory factor

B/S: butyrate + SAHA HDACi mixture

2i: PD0325901 (MEK inhibitor) + CHIR99021 (GSK3 inhibitor)

3i: 2i + SU5402 (FGFR inhibitor)

Parentheses: previous factor exposure

to the right of parentheses: current factor exposure

associated numbers: number of passages under those conditions

For example, H1p52(B/S3)2iF10 indicates H1 cultured for a total of 52 passages. Cells were exposed to butyrate + SAHA for three passages from p40–p42 and then to 2i + FGF for 10 passages from p43 to p52.

Culture of Pluripotent Cells.

Initial cultures of hESC [H1 (NIH code WA01), H7 (NIH code WA07), H9 (NIH code WA09), BG02, and HUES2], nonhuman primate M. fascicularis (MF-1), mEpiSC5, and mEpiSC7 ES cells were grown on a feeder layer of gamma-irradiated (3,000 Rad) primary mouse embryonic fibroblasts (MEFs) (7, 25). For cultures without feeders, cells were plated on Matrigel (BD Biosciences) diluted according to the manufacturer’s instructions. Cultures were incubated at 37 °C in 5% C02, 5% O2, and 90% N2. hESC culture medium consisted of high-glucose DMEM/F12 containing GlutaMax supplemented with 20% KnockOut serum replacer (SR), 1 mM sodium pyruvate, 0.1 mM nonessential amino acids, 50 U/mL penicillin, 50 mg/mL streptomycin (all from Invitrogen), and 0.1 mM β-mercaptoethanol (Sigma–Aldrich). To reverse toggle, hESCs were first cultured in the presence of an HDACi mixture containing 0.1 mM sodium butyrate (Sigma–Aldrich) plus 50 nM SAHA (B/S Cayman). Human LIF was used when LIF is specified for human and nonhuman primate ESCs. Factors were used at the following concentrations: 10 ng/mL hLIF (Chemicon), 10 ng/mL Activin A (Humanzyme), 10 ng/mL FGF2 (Invitrogen), 0.4–0.8 μM PD0325901 (Selleck), 1.0–3.0 μM CHIR99021 (Selleck), 2 μM SU5402 (Calbiochem), 0.1 μM NSC74859 (Selleck), and 10 μM Y-27632 (Selleck). Primed cells and human cells in B/S were exposed to 1.2 U/mL dispase (Invitrogen) dissolved in PBS supplemented with SR. Naïve cells and mouse cells in B/S were passaged using trypsin/EDTA (Invitrogen).

mESCs were cultured in either DMEM or DMEM/F12 with the additives described above, except the serum replacer was substituted with 20% FBS (ES qualified Invitrogen), unless otherwise stated. MEF-free cultures were grown on Matrigel- coated dishes using medium supplemented as indicated in the text. Mouse LIF was used at 1,000 units/mL for mESCs (ESGRO Chemicon).

Cells for undirected differentiation were seeded at ∼2 × 10 5 cells per uncoated, gelatinized, or Matrigel-treated 10-cm plate in DMEM (Invitrogen) containing 20% FBS (ES cell tested Invitrogen) with penicillin and streptomycin (Invitrogen). Cells were allowed to attach and fluid was changed every other day.

Establishment of Elf1.

Elf1 was thawed as a six- to eight-cell embryo, cultured to expanded blastocyst in blastocyst medium (Sage), and kept in a 5% CO2, 5% O2 atmosphere throughout. Four days after thaw, the zona pellucida was removed using Acidified Tyrode’s Solution and the zona-free embryo plated into one well of a 96-well plate seeded with feeders. The first passage was mechanical 3 d following the removal of the zona. Seven days later, passage was through mechanical plucking of a growth above the plated colony. Subsequent passages used Trypsin/EDTA. The culture seemed established by passage 5. Henceforth, the cells were passaged two times per week using trypsin/EDTA. Elf1 was bulk-frozen at passage 8 in hESC culture medium plus 10–12 ng/mL FGF2, 3 μM CHIR 99021, and 0.4 μM PD0329501 (2iF) using the cryoprotectant dimethylsufloxide (10% Sigma) and given the name Elf1, “El” to honor the Ellisons, who donated the funds for the work, and “f1” for female, line one. Elf1 is on the NIH Stem Cell Registry (0156 approved May 15, 2012) and is being banked at WiCell for distribution.

Microarray Analysis.

Whole mouse and whole human genome arrays (Agilent) were hybridized with total RNA from ESCs cultured with additives as indicated in the text. These were run in independent quadruplicate through the array facility at Seattle Biomedical Research Institute.

Microarray Data Preprocessing.

The data for each experiment were stored as raw, preprocessed, and processed in Synapse Commons Repository (https://synapse.sagebase.org/). With the exception of the Hunter et al. study (8) (GSE8881), we implemented the default one-color Affymetrix and default two-color Agilent workflows for each dataset. The former removes intensity-dependent array effects, and the latter removes both intensity-dependent array and dye effects. A single study, the Elf1 dataset, required a more sophisticated model, which in this case meant correcting for the effects of an outlier sample. Further methods are defined in ondersteunende informatie.

Immunohistochemistry.

Triple immunofluorescent labeling to detect endoderm in teratoma sections was performed as previously published with minor modifications (26). Methods are further defined in ondersteunende informatie.

Further methods for array analysis, immunohistochemistry, flow cytometry, quantitative PCR, XIST FISH, bisulfite sequencing, teratoma formation, karyotype analysis, and electron microscopy can be found in ondersteunende informatie.


Resultaten

ITGA6 and EPCAM can be used to isolate human PGCs from embryonic ovaries but not embryonic testes

Recently, in vitro human PGCLCs were isolated using INTEGRINα6 (ITGA6) and EPCAM following hiPSC differentiation [ 19] however, whether ITGA6/EPCAM can be used to isolate in vivo PGCs from human embryos has not been shown. To address this, we examined cells from a pair of human embryonic ovaries at 72 day postfertilization by staining with four antibodies that detect ITGA6, EPCAM, TNAP, and cKIT. cKIT and TNAP were used as a positive control, given that these surface proteins can be used to sort human PGCs from the prenatal embryonic ovary and testis [ 25, 29]. The labeled cells were divided in two and sorted by FACS gating on either ITGA6/EPCAM or TNAP/cKIT (Figure 1A). We discovered that the percentage of ITGA6/EPCAM double positive cells and TNAP/cKIT double positive cells in the embryonic ovary was comparable (Figure 1A). Furthermore, the ITGA6/EPCAM double positive population was also double positive for TNAP/cKIT. Conversely, the TNAP/cKIT double positive cells were also double positive for ITGA6/EPCAM (Figure 1A). Using real-time PCR, we show that both populations expressed PGC genes at equivalent levels (Figure 1B). We repeated this experiment with a pair of human embryonic ovaries at 94 day, and found a similar result (Figure 1A and B). Therefore, these observations indicate that ITGA6/EPCAM can be used to isolate TNAP/cKIT positive germ cells from the human embryonic ovary and vice versa.

Analysis of ITGA6/EPCAM and TNAP/cKIT populations in human prenatal gonads. (A) Flow cytometry of prenatal ovaries at day (d) 72 and 94 postfertilization stained with antibodies that recognize ITGA6, EPCAM, TNAP, and cKIT. (B) Gene expression of the sorted populations from (A, 72d) by real-time PCR. Expression is normalized to the GAPDH. Fold change is calculated relative to expression levels of each gene in female hESC line UCLA1 (passage 17 (p17) and p18), which was given a value of 1.0. (C) Flow cytometry of prenatal testis at day 85 and 104 postfertilization stained with ITGA6, EPCAM, TNAP, and cKIT. (D) Gene expression of the sorted populations from (C, 85d) by real-time PCR. For each gene examined, its expression is normalized to the GAPDH. Fold change is calculated relative to expression levels of each gene in male hESC line UCLA2 (p11 and p12), which was given a value of 1.0. (E) Unsupervised hierarchical clustering (UHC) of transcriptomes of female hESC line UCLA1 (two biological replicates, p14 and p15), male hESC line UCLA2 (two biological replicates, p13 and p14), TNAP/cKIT positive germ cells from embryonic day 59 testes, ITGA6/EPCAM positive cells from 89d, 103d, and another 89d embryonic ovary. TNAP/cKIT positive cells from 89d ovaries. Asterisk in E–G indicates that the two RNA-seq libraries were made from the same pair of ovaries but sorted with different surface markers. (F) PCA of transcriptomes shown in E. (G) Scatter plot of two transcriptomes made from the same pair of ovaries but sorted with ITGA6/EPCAM (x-axis) and TNAP/cKIT (y-axis).

Analysis of ITGA6/EPCAM and TNAP/cKIT populations in human prenatal gonads. (A) Flow cytometry of prenatal ovaries at day (d) 72 and 94 postfertilization stained with antibodies that recognize ITGA6, EPCAM, TNAP, and cKIT. (B) Gene expression of the sorted populations from (A, 72d) by real-time PCR. Expression is normalized to the GAPDH. Fold change is calculated relative to expression levels of each gene in female hESC line UCLA1 (passage 17 (p17) and p18), which was given a value of 1.0. (C) Flow cytometry of prenatal testis at day 85 and 104 postfertilization stained with ITGA6, EPCAM, TNAP, and cKIT. (D) Gene expression of the sorted populations from (C, 85d) by real-time PCR. For each gene examined, its expression is normalized to the GAPDH. Fold change is calculated relative to expression levels of each gene in male hESC line UCLA2 (p11 and p12), which was given a value of 1.0. (E) Unsupervised hierarchical clustering (UHC) of transcriptomes of female hESC line UCLA1 (two biological replicates, p14 and p15), male hESC line UCLA2 (two biological replicates, p13 and p14), TNAP/cKIT positive germ cells from embryonic day 59 testes, ITGA6/EPCAM positive cells from 89d, 103d, and another 89d embryonic ovary. TNAP/cKIT positive cells from 89d ovaries. Asterisk in E–G indicates that the two RNA-seq libraries were made from the same pair of ovaries but sorted with different surface markers. (F) PCA of transcriptomes shown in E. (G) Scatter plot of two transcriptomes made from the same pair of ovaries but sorted with ITGA6/EPCAM (x-axis) and TNAP/cKIT (y-axis).

Next, we performed the same analysis using embryonic testes. Unlike the ovary, we discovered that most ITGA6/EPCAM double positive cells are negative for TNAP/cKIT (Figure 1C), and the ITGA6/EPCAM double positive cells have reduced levels of PGC genes relative to the TNAP/cKIT double positive population (Figure 1D). Given that ITGA6 and EPCAM are epithelial markers [ 30, 31], and PGCs in the embryonic testis are known to be enclosed within epithelial cords [ 25], we reasoned that ITGA6 and EPCAM double positive cells are a mixture of both germ cells and somatic cells in prenatal testis. To test this, we performed immunofluorescence and real-time PCR and show that ITGA6 and EPCAM are expressed by both PGCs and epithelial Sertoli cells (Figure S1A and B), and the ITGA6/EPCAM double positive population is also enriched in Sertoli cell genes SOX9 en AMH (Figure 1D). Therefore, using prenatal tissues containing PGCs, TNAP/cKIT can be used to sort PGCs from both the embryonic ovary and testis, whereas ITGA6/EPCAM can only be used to sort PGCs from the embryonic ovary.

Next, we performed RNA-seq on sorted ITGA6/EPCAM female PGCs at 89 and 103 day (Figure 1E and F), and compared this to a third sample involving a pair of ovaries collected at 89 d, which were pooled and then stained and sorted separately for ITGA6/EPCAM or TNAP/cKIT (Figure 1E–G, marked by asterisk). We also included a testis at 59 day, which was sorted only using TNAP/cKIT to specifically isolate the male PGCs. Using unsupervised hierarchical clustering (UHC), the sorted PGC samples clustered together forming a distinct group relative to an undifferentiated female hESC line (UCLA1), and a male hESC line (UCLA2) (Figure 1E). Evaluation of candidate genes revealed that all putative PGC samples expressed the early and late stage PGC genes and have acquired a naïve pluripotent signature (Figure S1C). Moreover, the ITGA6/EPCAM and TNAP/cKIT PGCs sorted from the same pair of 89 day embryonic ovaries clustered the closest compared to ITGA6/EPCAM populations sorted from different ovaries (Figure 1E). This result further supports the conclusion that ITGA6/EPCAM and TNAP/cKIT are expressed on the same population of PGCs. To better display the similarities and differences between samples, we performed PCA, and found that the PGCs are well separated from undifferentiated hESCs along the PC1 axis, while the 59-day male TNAP/cKIT PGCs are separated from the other gonadal PGCs along the PC2 axis (Figure 1F). This separation is anticipated to be caused by the 4-week difference in age between male and female samples in this study, as well as gender [ 32]. Last, we examined the differentially expressed genes (DEGs) between ITGA6/EPCAM and TNAP/cKIT positive cells sorted from the same ovary pair and found very few DEGs as the two transcriptomes are highly correlated with linear regression R squared = 0.98 (Figure 1G). Therefore, we propose that ITGA6/EPCAM and TNAP/cKIT are coexpressed on the same cell population in the embryonic ovary.

Germline competency is associated with the induction of genes required for primitive streak formation

Prior to examining PGCLC differentiation across 18 independently derived UCLA hESC lines with ITGA6/EPCAM/TNAP/cKIT, we first piloted the sorting strategy on the male hESC line UCLA2. We discovered that all ITGA6/EPCAM double positive putative PGCLCs at day 4 of differentiation were positive for TNAP however, cKIT was not detected on the PGCLC population (Figure S2A). In mice, cKIT is critical for PGC survival, migration, and proliferation [ 33– 35]. In humans, cKIT is present on PGCs from at least week 4 to week 20 of prenatal life postfertilization [ 25, 29, 32, 36]. Furthermore, analysis of cyno PGCs during gastrulation reveals that cKIT RNA is expressed by PGCs at the time of specification [ 3]. Thus, we reasoned that cKIT is either not translated in early stage human PGCs, or alternatively the conditions for PGCLC induction must be optimized to enable cKIT expression on the cell surface. Given that cKIT is subject to ligand induced endocytosis [ 37], we removed the ligand SCF from the PGCLC media, and this resulted in ITGA6/EPCAM/TNAP/cKIT positive PGCLCs (Figure S2B and D). To determine if excluding SCF affects germ cell identity, we performed real-time PCR and RNA-Seq of the putative ITGA6/EPCAM positive PGCLCs differentiated with or without SCF (Figure S2C and E). To determine the molecular similarity of PGCLCs generated in primed conditions on MEFs, to those generated from hESCs cultured in 4i on MEFs [ 12], we differentiated the WIS2 hESC line for 4 days according to the methods of Irie et al. [ 12] and sorted the TNAP/NANOS3-mCherry PGCLC population. RNA-seq analysis showed that PGCLCs generated from either the primed or 4i cultured hESCs clustered together, and were distinct from the undifferentiated hESCs (Figure S2E and F), indicating that the starting culture media (4i on MEFs versus primed media on MEFs) ultimately yielded PGCLCs with similar transcriptional identities.

Using ITGA6/EPCAM as a sorting approach to analyze PGCLCs, we next examined PGCLC competency of 18 hESC lines, all derived at UCLA from 18 single frozen embryos (Figure 2A). All hESC lines were capable of teratoma formation when injected into severe combined immunocompromized (SCID) beige mice (UCLA1–6 [ 22] UCLA8–10, UCLA14, UCLA16–18 [ 23] and this study UCLA7, UCLA11–13, and UCLA15: Figure S3A–C). Seventeen out of eighteen hESC lines are karyotypically normal, while UCLA7 has a duplication of chromosome 13 in 100% of cells karyotyped (Figure S3B). We included this cell line in the analysis to determine whether aneuploidy may be associated with alterations in PGCLC potential. It has been previously reported that PGCLC induction efficiency is variable between experiments [ 12, 19]. In order to minimize variability, we induced PGCLCs from 18 hESC lines simultaneously and repeated this experiment four times to determine the average PGCLC induction efficiency for all 18 lines. All 18 independently derived hESC lines were germline competent. However, UCLA6 consistently exhibited the highest germline potential generating on average 35% PGCLCs at day 4 of aggregate formation, whereas UCLA9 had the lowest germline potential generating on average less than 1% PGCLCs at day 4 (Figure 2A Figure S3D). The aneuploid UCLA7 female hESC line generated a comparable percentage of PGCLCs to the other female hESC lines in the data set. Meanwhile, we found that male hESC lines on average were more competent for PGCLC induction than female (Figure 2B).

Germline competency varies between independent hESC lines. (A) Average PGCLC induction efficiency at day 4 in aggregates generated from 18 hESC lines (passage numbers ranging from p10 to p22, see experimental procedures for details). Blue represents male and pink represents female. “a*” indicates the significant difference between UCLA6 and all other cell lines and “b*” indicates the significant difference between UCLA2 and UCLA9 (tested by ANOVA, P < 0,0001). PGCLCs were identified as ITGA6/EPCAM double positive cells. (B) Comparison of day 4 PGCLC induction efficiency from male (blue) and female (pink) hESC lines. “ * ” indicates the difference between male and female (t-test, P < 0,05). (C) Heat map showing the expression of genes in iMeLCs that positively correlated with PGCLC induction efficiency. Genes are selected as maximal expression <= 2 (RPKM) in hESCs, maximal expression >= 2 (RPKM) in iMeLCs, and correlation coefficient >0.45.

Germline competency varies between independent hESC lines. (A) Average PGCLC induction efficiency at day 4 in aggregates generated from 18 hESC lines (passage numbers ranging from p10 to p22, see experimental procedures for details). Blue represents male and pink represents female. “a*” indicates the significant difference between UCLA6 and all other cell lines and “b*” indicates the significant difference between UCLA2 and UCLA9 (tested by ANOVA, P < 0,0001). PGCLCs were identified as ITGA6/EPCAM double positive cells. (B) Comparison of day 4 PGCLC induction efficiency from male (blue) and female (pink) hESC lines. “ * ” indicates the difference between male and female (t-test, P < 0,05). (C) Heat map showing the expression of genes in iMeLCs that positively correlated with PGCLC induction efficiency. Genes are selected as maximal expression <= 2 (RPKM) in hESCs, maximal expression >= 2 (RPKM) in iMeLCs, and correlation coefficient >0.45.

In a recent study using nine hiPSC lines, it was determined that primitive streak genes were associated with PGCLC competency [ 21]. To determine whether this was also the case for hESCs, we performed RNA-seq on the 18 hESC lines, and the corresponding iMeLCs in biological duplicate. We used the following parameters to define genes whose expression levels in iMeLCs are positively correlated with PGCLC induction efficiency. First, we chose genes that were expressed at low levels or not expressed in hESCs by setting the RPKM value < 2. Second, we used the RPKM value > 2 in at least one of the 18 iMeLC samples to select for genes that are upregulated in at least one of the 18 hESC lines induced to become iMeLCs. Third, we correlated gene expression in iMeLCs with PGCLC induction efficiency, and set the cutoff as >0.45. Based on these parameters, we found 78 genes upregulated from hESCs to iMeLCs that were also positively correlated with resulting PGCLC induction efficiency in the aggregates (Figure 2C). Using gene ontogeny (GO) term analysis of these 78 genes by WebGestalt [ 38, 39], we discovered that the top term was “formation of primary germ layer” (GO: 0001704), which included seven genes: EOMES, T, GATA6, MIXL1, GATA4, WLS, en LHX1. These genes are associated with primitive streak formation that are known to be induced by NODAL/ACTIVIN A (TGFβ) and WNT [ 40].

Signaling pathways that promote primitive streak formation are also required for PGCLC induction

Next, we confirmed the relationship between TGFβ and WNT signaling pathways, and the expression of t en EOMES in iMeLCs. We performed immunofluorescence and identified nuclear accumulation of phosphorylated SMAD2/3 (pSMAD2/3) (Figure 3A) and β-CATENIN (Figure 3B) in both iMeLCs and hESCs, indicating that these cells are capable of responding to both signaling pathways. We then confirmed expression of T (Figure 3C) and EOMES (Figure 3D) protein by immunofluorescence, and as predicted from the RNA-Seq, T was induced in iMeLCs (Figure 3C), and EOMES protein was expressed in both hESCs and in iMeLCs (Figure 3D).

TGFβ and WNT signaling are required for PGCLC induction from hESCs. (A--D) Expression of pSMAD2/3 (A), β-CATENIN (B), T (C), and EOMES (D) in UCLA1 hESCs and iMeLCs. Scale bar: 10 μm. (E) Schematic illustration of PGCLC induction with or without SB431542 (SB) and DKK1. (F) Real-time PCR for t en EOMES expression at iMeLCs in the presence of SB431542 and DKK1. (G) Flow cytometry showing loss of PGCLC competency in media containing SB431542 and DKK1.

TGFβ and WNT signaling are required for PGCLC induction from hESCs. (A--D) Expression of pSMAD2/3 (A), β-CATENIN (B), T (C), and EOMES (D) in UCLA1 hESCs and iMeLCs. Scale bar: 10 μm. (E) Schematic illustration of PGCLC induction with or without SB431542 (SB) and DKK1. (F) Real-time PCR for t en EOMES expression at iMeLCs in the presence of SB431542 and DKK1. (G) Flow cytometry showing loss of PGCLC competency in media containing SB431542 and DKK1.

The correlation of germline competency with TGFβ and WNT signaling, as well as t en EOMES induction promoted us to test if these molecules are critical for PGCLC formation. To block TGFβ signaling we added SB431542 [ 41], which inhibits the TGFβ type I receptors ALK5, ALK4, and ALK7, and phosphorylation of SMAD2 and SMAD3. This inhibitor does not block the ALKs or SMADs downstream of BMP4. To block WNT receptor binding, we added DKK1 [ 42] (Figure 3E). We discovered that the addition of these two molecules prevented the induction of t en EOMES in iMeLCs despite the presence of ACTIVIN A and GSK3βi in the iMeLC media (Figure 3F). In order to determine if t en EOMES expression is dependent on TGFβ or WNT, or both, we evaluated t en EOMES expression in iMeLCs in the presence of either SB431542 or DKK1. We found that t en EOMES were repressed in the presence of either SB431512 or DKK1 (Figure S4A and B), suggesting the expression of t en EOMES in iMeLCs requires both TGFβ and WNT signaling. To evaluate the effect on germline competency, we induced PGCLCs in media with or without SB431542 and DKK1 (Figure 3E). We discovered that the PGCLC population was completely abolished when SB431542 and DKK1 were included in the media, despite the presence of exogenous BMP4 and other cytokines known to induce PGCLC fate (Figure 3G). These results suggest that the ability to respond to TGFβ and WNT signaling and potentially the induction of genes associated with primitive streak formation such as t en EOMES are required for germline induction.

EOMES is required for PGCLC induction

To provide direct evidence for EOMES in PGCLC induction, we used CRISPR/Cas9 to mutate EOMES in the UCLA1 hESC line (Figure S4C). We used two independent EOMES mutant clones for analysis. By differentiating the EOMES mutant and control hESC lines in parallel, we found that the ITGA6/EPCAM double positive PGCLC population was dramatically reduced in the EOMES mutant clones (Figure 4A–B). To confirm this result, we also performed immunofluorescence on aggregates and detected PGCLCs by triple staining for TFAP2C, SOX17, and PRDM1. In wild-type control cells, we detected clusters of triple TFAP2C, SOX17, and PRDM1 human PGCLCs (Figure 4C, white dot outlined). Echter, in de EOMES mutant lines, we identified very few triple positive PGCLCs (Figure 4C, white arrowheads). Therefore, our results demonstrate that EOMES is required for PGCLC formation in human, most likely downstream of WNT and TGFβ.

EOMES is required for PGCLC induction from hESCs. (A) Flow cytometry showing reduced PGCLC competency in EOMES mutant hESC line. PGCLCs were identified as ITGA6/EPCAM double positive cells. (B) Summary of PGCLC induction percentage from control and two different EOMES mutant hESC clones. (C) Control and EOMES mutant day 4 aggregates stained with TFAP2C (green), SOX17 (red), PRDM1 (purple), and DAPI (white). White dot outlines TFAP2C/SOX17/PRDM1 triple positive PGCLCs in control. White arrowheads point to rare TFAP2C/SOX17/PRDM1 triple positive PGCLCs in EOMES mutant. (D) Flow cytometry analysis of PGCLCs made from mixed iMeLCs (1:1 ratio) made from GFP negative and GFP positive wild-type hESCs. Left panel shows GFP positive cells in all live cells from PGCLC aggregates. Middle panel shows PGCLCs positive for ITGA6 and EPCAM. Right panel shows GFP positive PGCLCs. (E) Same analysis as (D) for PGCLCs made from mixed iMeLCs (1:1 ratio) made from GFP negative wild-type hESCs and GFP positive EOMES mutant hESCs.

EOMES is required for PGCLC induction from hESCs. (A) Flow cytometry showing reduced PGCLC competency in EOMES mutant hESC line. PGCLCs were identified as ITGA6/EPCAM double positive cells. (B) Summary of PGCLC induction percentage from control and two different EOMES mutant hESC clones. (C) Control and EOMES mutant day 4 aggregates stained with TFAP2C (green), SOX17 (red), PRDM1 (purple), and DAPI (white). White dot outlines TFAP2C/SOX17/PRDM1 triple positive PGCLCs in control. White arrowheads point to rare TFAP2C/SOX17/PRDM1 triple positive PGCLCs in EOMES mutant. (D) Flow cytometry analysis of PGCLCs made from mixed iMeLCs (1:1 ratio) made from GFP negative and GFP positive wild-type hESCs. Left panel shows GFP positive cells in all live cells from PGCLC aggregates. Middle panel shows PGCLCs positive for ITGA6 and EPCAM. Right panel shows GFP positive PGCLCs. (E) Same analysis as (D) for PGCLCs made from mixed iMeLCs (1:1 ratio) made from GFP negative wild-type hESCs and GFP positive EOMES mutant hESCs.

In cyno embryos, nascent PGCs in the amnion are negative for EOMES [ 3]. Similarly, our RNA-seq data show that EOMES is not expressed in prenatal PGCs or PGCLCs. Therefore, we hypothesize that EOMES acts either noncell autonomously in the niche to support PGCLC formation, or alternatively EOMES acts cell autonomously in iMeLCs to prime PGC fate. To test this, we made stable GFP lines of control and EOMES mutant hESCs. We made iMeLCs and generated PGCLC aggregates containing a mix of GFP and unlabeled cells in a 1:1 ratio. The iMeLC mixtures were composed of GFP-labeled control cells with unlabeled controls (Figure 4D) or GFP-labeled EOMES mutant cells with unlabeled controls (Figure 4E). In the controls, about 45% of the total cells were positive for GFP, and about 35% of the PGCLCs were positive. Therefore, control hESCs with or without GFP both contribute to PGCLC induction (Figure 4D). In contrast, only about 8% of the PGCLCs were induced from GFP-labeled EOMES mutant cells, whereas the total cells were composed of about 48% GFP-labeled EOMES mutant cells (Figure 4E). This suggests that EOMES is required cell autonomously to prime PGC fate.


New genetic tools for hPSC research

To use hPSCs for studies of human development and disease, it is essential to develop powerful genetic tools. Below, we highlight recent advances that enable both the generation of tissue-specific fluorescent reporter lines and the perturbation of gene expression. The strengths and weaknesses of transgenic approaches have been extensively discussed elsewhere (Giudice and Trounson, 2008) of note, the main advantages are the convenience and experimental feasibility of the approach, while the drawbacks include position effects, copy number variation and transgene silencing. Instead, we focus on the gene targeting approach, which has undergone a major transformation in recent years and may revolutionize genetic studies in hPSCs.

Gene targeting mediated by ZFNs and TALENs

Gene targeting refers to the introduction of site-specific modifications into the genome by homologous recombination (HR). This approach is widely used in the mouse to generate null (complete loss-of-function) or hypomorphic (partial loss-of-function) mutations, or to create reporter genes to track the expression of an endogenous transcript. Since the first successful targeting of the mouse Hprt gene (Doetschman et al., 1987 Thomas and Capecchi, 1987), numerous murine genes have been targeted. However, only a small number of loci have been successfully targeted using conventional gene targeting methods in hPSCs, owing to the low efficiency of HR (Hockemeyer and Jaenisch, 2010). This is now poised to change.

It has long been recognized that inducing a DNA double-stranded break (DSB) at the target locus substantially increases the efficiency of HR (Puchta et al., 1993 Rouet et al., 1994 Smih et al., 1995). Based on this idea, two methods have been developed to introduce DSBs at the target site. These involve zinc-finger nucleases (ZFNs see Box 1) and, more recently, transcription activator-like (TAL) effector nucleases (TALENs see Box 1). These engineered chimeric proteins are composed of separate DNA-binding and DNA-cleavage domains, which enable them to act as ‘genomic scissors’ that can induce DNA breaks at specific genomic loci. In the presence of a donor DNA fragment containing homology arms to the target locus, HR-mediated DNA repair results in the insertion of the donor DNA sequence into the specific genomic locus. This approach can be used to generate point mutations, genomic deletions and insertions of reporter genes.


Bekijk de video: DNA Sequencing - 3D (Januari- 2022).