Informatie

Detecteer differentieel tot expressie brengende cellen


Ik heb gegevens (RNA-expressiewaarden, verkregen met in situ hybridisatie) verzameld van 1 miljoen menselijke cellen. Voor elke cel heb ik de expressiewaarde van een negatieve controle (niet-humaan RNA) en eencellige metingen voor verschillende RNA-soorten. Ik weet dat de waarden van de negatieve controle lineair correleren met alle andere RNA-soorten. Wanneer een cel bijvoorbeeld een hoge expressiewaarde van de negatieve controle heeft, zal het signaal voor alle andere RNA-soorten ook hoog zijn. Ik wil nu de cellen detecteren die een RNA tot expressie brengen zonder een hoog negatief signaal te hebben, b.v. de "echte" tot expressie brengende cellen.

Een ding om in gedachten te houden is dat sommige RNA-soorten overvloedig tot expressie komen in veel cellen, andere zeer zeldzaam zijn en een lage expressiewaarde hebben.

Ik heb geprobeerd dit te doen met een lineair model (voor elk van de RNA-soorten, negatieve controle versus enkel RNA), z-scores berekenen, p-waarden afleiden en corrigeren voor meervoudig testen. Voor sommige RNA-soorten werkt het prima. Zodra ik veel cellen heb die een bepaald RNA tot expressie brengen, wordt het lastiger omdat de helling van het lineaire model niet de lineaire relatie van negatieve controle versus RNA-soorten in niet tot expressie brengende cellen weerspiegelt, omdat het meer verschoven is naar de "echte" tot expressie brengende cellen.

Om het probleem te visualiseren, heb ik twee percelen bijgevoegd. Eén plot die hoge RNA-expressie van veel cellen laat zien (linker plot) en één van een RNA-soort die op een zeer laag niveau tot expressie wordt gebracht in enkele cellen (rechterplot). Blauw gekleurde stippen worden volgens het lineaire model beschouwd als cellen die tot expressie komen. Zoals u kunt zien, worden voor het scenario dat aan de linkerkant wordt getoond, veel "echte" tot expressie brengende cellen niet gedetecteerd.

Enig idee welk statistisch model beter zou passen om die cellen te detecteren?

Bedankt voor je suggesties!


Hoe de expressie van een bepaald eiwit van een cel te detecteren?

Identificatie van een specifiek eiwit in een complex mengsel van eiwitten kan worden bereikt door een techniek die bekend staat als Western-blotting, genoemd naar zijn gelijkenis met Southern-blotting, dat DNA-fragmenten detecteert, en Northern-blotting, dat mRNA's detecteert.

Bij Western-blotting wordt een eiwit elektroforetisch gescheiden op gel (denaturerende omstandigheden of natuurlijke/niet-denaturerende omstandigheden).

De eiwitten worden vervolgens overgebracht naar een membraan (meestal nitrocellulose of PVDF), waar ze worden onderzocht (gedetecteerd) met behulp van antilichamen die specifiek zijn voor het doeleiwit. De Ag-Ab-complexen die zich vormen op de band die het eiwit bevat dat door het antilichaam wordt herkend, kunnen op verschillende manieren worden gevisualiseerd. Als het eiwit van belang was gebonden door een radioactief antilichaam, kan de positie ervan op de vlek worden bepaald door het membraan bloot te stellen aan een vel röntgenfilm, een procedure die autoradiografie wordt genoemd.

De meest algemeen gebruikte detectieprocedures maken echter gebruik van enzymgebonden antilichamen tegen het eiwit. Na binding van het enzym-antilichaamconjugaat veroorzaakt toevoeging van een chromogeen substraat dat een sterk gekleurd en onoplosbaar product produceert, het verschijnen van een gekleurde band op de plaats van het doelantigeen. De plaats van het van belang zijnde eiwit kan met veel hogere gevoeligheid worden bepaald als een chemiluminescente verbinding samen met geschikte versterkende middelen wordt gebruikt om licht op de antigeenplaats te produceren.

Western blotting kan ook een specifiek antilichaam in een mengsel identificeren. In dit geval worden bekende antigenen met een goed gedefinieerd molecuulgewicht gescheiden door SDS-PAGE en geblot op nitrocellulose. De gescheiden banden van bekende antigenen worden vervolgens onderzocht met het monster waarvan wordt vermoed dat het antilichaam bevat dat specifiek is voor een of meer van deze antigenen.

Reactie van een antilichaam met een band wordt gedetecteerd door gebruik te maken van radioactief gelabeld of enzymgebonden secundair antilichaam dat specifiek is voor de soort van de antilichamen in het testmonster. De meest gebruikte toepassing van deze procedure is in bevestigende tests voor HIV, waarbij Western-blotting wordt gebruikt om te bepalen of de patiënt antilichamen heeft die reageren met een of meer virale eiwitten.

De methode is afkomstig uit het laboratorium van George Stark in Stanford. De naam Western blot werd aan de techniek gegeven door W Neal Burnette.

Stappen in een Western Blot:

Weefselvoorbereiding:

Monsters kunnen worden genomen uit heel weefsel of uit celkweek of uit cellysaat. In de meeste gevallen worden vaste weefsels eerst mechanisch afgebroken met behulp van een blender (voor grotere monstervolumes), met behulp van een homogenisator (kleinere volumes) of door sonicatie. Cellen kunnen ook worden opengebroken door een van de bovengenoemde mechanische methoden.

Geassorteerde detergentia, zouten en buffers kunnen worden gebruikt om lysis van cellen te stimuleren en eiwitten op te lossen. Protease- en fosfataseremmers worden vaak toegevoegd om de vertering van het monster door zijn eigen enzymen te voorkomen. Een combinatie van biochemische en mechanische technieken, waaronder verschillende soorten filtratie en centrifugatie, kan worden gebruikt om verschillende celcompartimenten en organellen te scheiden.

Gelelektroforese:

De eiwitten van het monster worden gescheiden met behulp van gelelektroforese. Scheiding van eiwitten kan zijn door iso-elektrisch punt (pi), molecuulgewicht, elektrische lading of een combinatie van deze factoren. De aard van de scheiding hangt af van de behandeling van het monster en de aard van de gel (voor details verwijzen wij u naar '8220elektroforetische techniek'8221).

Verreweg het meest voorkomende type gelelektroforese maakt gebruik van polyacrylamidegels en buffers die zijn beladen met natriumdodecylsulfaat (SDS). SDS-PAGE (SDS-polyacrylamidegelelektroforese) houdt polypeptiden in een gedenatureerde staat nadat ze zijn behandeld met sterke reductiemiddelen om secundaire en tertiaire structuur te verwijderen (bijv. SS-disulfidebindingen aan SH en SH) en maakt zo scheiding van eiwitten door hun moleculaire gewicht.

Bemonsterde eiwitten worden bedekt met het negatief geladen SDS en verplaatsen zich naar de positief geladen elektrode door het acrylamidegaas van de gel. Kleinere eiwitten migreren sneller door dit gaas en de eiwitten worden dus gescheiden op grootte (meestal gemeten in kilo dalton, kDa). De concentratie van acrylamide bepaalt de resolutie van de gel - hoe groter de acrylamideconcentratie, hoe beter de resolutie van eiwitten met een hoger molecuulgewicht. Eiwitten reizen voor de meeste blots slechts in één dimensie langs de gel.

Monsters worden in putjes in de gel geladen. Eén baan is gewoonlijk gereserveerd voor een marker of ladder, een in de handel verkrijgbaar mengsel van eiwitten met gedefinieerde molecuulgewichten, typisch gekleurd om zichtbare, gekleurde banden te vormen. Wanneer er spanning langs de gel wordt aangelegd, migreren eiwitten er met verschillende snelheden in. Deze verschillende voortgangssnelheden (verschillende elektroforetische mobiliteiten) scheiden zich in banden binnen elke baan.

Het is ook mogelijk om een ​​tweedimensionale (2-D) gel te gebruiken die de eiwitten van een enkel monster in twee dimensies uitspreidt. Eiwitten worden gescheiden volgens iso-elektrisch punt (pH waarbij ze een neutrale nettolading hebben) in de eerste dimensie, en volgens hun molecuulgewicht in de tweede dimensie.

Overdracht:

Om de eiwitten toegankelijk te maken voor antilichaamdetectie, worden ze vanuit de gel naar een membraan van nitrocellulose of PVDF verplaatst. Het membraan wordt bovenop de gel geplaatst die op een stapel papieren handdoeken rust, en een stapel tissuepapier wordt daar bovenop geplaatst. De hele opstelling wordt in een bufferoplossing geplaatst die door capillaire werking op het papier omhoog beweegt en de eiwitten meeneemt.

Een andere methode voor het overbrengen van de eiwitten wordt elektroblotting genoemd en gebruikt een elektrische stroom om eiwitten uit de gel in het PVDF- of nitrocellulosemembraan te trekken. De eiwitten zijn nu vanuit de gel naar het membraan verplaatst terwijl ze de organisatie die ze in de gel hadden behouden. Als resultaat van dit '8220blotting'-proces worden de eiwitten voor detectie op een dunne oppervlaktelaag belicht.

Beide soorten membraan zijn gekozen vanwege hun niet-specifieke eiwitbindende eigenschappen (d.w.z. bindt alle eiwitten even goed). Eiwitbinding is gebaseerd op hydrofobe interacties en op geladen interacties tussen het membraan en eiwit. Nitrocellulosemembranen zijn goedkoper dan PVDF, maar zijn veel kwetsbaarder en zijn niet goed bestand tegen herhaalde sonderingen.

De uniformiteit en algehele effectiviteit van de overdracht van eiwit van de gel naar het membraan kan worden gecontroleerd door het membraan te kleuren met Coomassie- of Ponceau S-kleurstoffen. Coomassie is de meest gevoelige van de twee, hoewel de oplosbaarheid in water van Ponceau S het gemakkelijker maakt om het membraan vervolgens te ontkleuren en te onderzoeken.

Blokkeren:

Aangezien het membraan is gekozen vanwege zijn vermogen om eiwit te binden, en zowel antilichamen als het doelwit eiwitten zijn, moeten stappen worden ondernomen om interacties tussen het membraan en het antilichaam dat wordt gebruikt voor detectie van het doelwiteiwit te voorkomen. Blokkering van niet-specifieke binding wordt bereikt door het membraan in een verdunde oplossing van eiwit te plaatsen, typisch runderserumalbumine (BSA) of magere melkpoeder (beide zijn goedkoop), met een miniem percentage wasmiddel zoals Tween 20 .

Het eiwit in de verdunde oplossing hecht zich aan het membraan op alle plaatsen waar de doeleiwitten niet hebben gehecht. Wanneer het antilichaam wordt toegevoegd, is er dus geen ruimte op het membraan om zich te hechten, behalve op de bindingsplaatsen van het specifieke doeleiwit. Dit vermindert 'ruis' in het eindproduct van de Western-blot, wat leidt tot duidelijkere resultaten en elimineert valse positieven.

Detectie:

Tijdens het detectieproces wordt het membraan 'onderzocht' op het eiwit van belang met een gemodificeerd antilichaam dat is gekoppeld aan een gerapporteerd enzym, dat bij blootstelling aan een geschikt substraat een colorimetrische reactie veroorzaakt en een kleur produceert. Om verschillende redenen gebeurt dit traditioneel in een tweestapsproces, hoewel er nu voor bepaalde toepassingen éénstapsdetectiemethoden beschikbaar zijn.

1. Primaire antilichaamsonde:

Antilichamen worden gegenereerd wanneer een gastheersoort of immuuncelcultuur wordt blootgesteld aan het eiwit van belang (of een deel daarvan). Normaal gesproken maakt dit deel uit van de immuunrespons, terwijl ze hier worden geoogst en gebruikt als gevoelige en specifieke detectietools die het eiwit direct binden.

Na blokkering wordt een verdunde oplossing van primair antilichaam (in het algemeen tussen 0,5 en 5 microgram/ml) onder voorzichtig roeren met het membraan geïncubeerd. Meestal bestaat de oplossing uit een gebufferde zoutoplossing met een klein percentage wasmiddel en soms met melkpoeder of BSA.

De antilichaamoplossing en het membraan kunnen overal van 30 minuten tot een nacht samen worden verzegeld en geïncubeerd. Het kan ook bij verschillende temperaturen worden geïncubeerd, waarbij warmere temperaturen worden geassocieerd met meer binding, zowel specifiek (voor het doeleiwit, het '8220signaal'8221) als niet-specifiek ('8220ruis'8221).

2. Secundair antilichaamonderzoek:

Na spoelen van het membraan om ongebonden primair antilichaam te verwijderen, wordt het membraan blootgesteld aan een ander antilichaam, gericht tegen een soortspecifiek deel van het primaire antilichaam. Dit staat bekend als een secundair antilichaam en wordt vanwege zijn richtende eigenschappen vaak aangeduid als “anti-muis, ” “anti-geit,” enz. Antilichamen zijn afkomstig van dierlijke bronnen (of van dieren afkomstig hybridomaculturen) zal een secundair anti-muis binden aan zowat elk primair antilichaam dat afkomstig is van muizen.

Dit maakt enige kostenbesparingen mogelijk doordat een heel laboratorium een ​​enkele bron van in massa geproduceerd antilichaam kan delen, en levert veel consistentere resultaten op. Het secundaire antilichaam is gewoonlijk gekoppeld aan biotine of aan een gerapporteerd enzym zoals alkalische fosfatase of mierikswortelperoxidase. Dit betekent dat verschillende secundaire antilichamen aan één primair antilichaam zullen binden en het signaal versterken.

Meestal wordt een aan mierikswortelperoxidase gekoppeld secundair gebruikt in combinatie met een chemiluminescerend middel, en het reactieproduct produceert luminescentie in verhouding tot de hoeveelheid eiwit. Een gevoelig vel fotografische film wordt tegen het membraan geplaatst en blootstelling aan het licht van de reactie creëert een beeld van de antilichamen die aan de blot zijn gebonden.

Net als bij de ELISPOT- en ELISA-procedures kan het enzym worden voorzien van een substraatmolecuul dat door het enzym wordt omgezet in een gekleurd reactieproduct dat zichtbaar zal zijn op het membraan. Een derde alternatief is het gebruik van een radioactief label in plaats van een enzym dat aan het secundaire antilichaam is gekoppeld. Omdat andere methoden veiliger, sneller en goedkoper zijn, wordt deze methode nu zelden gebruikt.

(B) Eenstapsverwerking:

Historisch gezien werd het sondeerproces in twee stappen uitgevoerd vanwege het relatieve gemak van het produceren van primaire en secundaire antilichamen in afzonderlijke processen. Dit geeft onderzoekers en bedrijven enorme voordelen op het gebied van flexibiliteit en voegt een versterkingsstap toe aan het detectieproces. Gezien de komst van eiwitanalyse met een hoge doorvoer en lagere detectielimieten, is er echter interesse geweest in het ontwikkelen van eenstaps sondeersystemen waarmee het proces sneller en met minder verbruiksgoederen kan plaatsvinden.

Dit vereist een probe-antilichaam dat zowel het eiwit van belang herkent als detecteerbare labelprobes die vaak beschikbaar zijn voor bekende eiwitlabels. De primaire sonde wordt met het membraan geïncubeerd op een manier die vergelijkbaar is met die voor het primaire antilichaam in een tweestapsproces en is dan klaar voor directe detectie na een reeks wasstappen.

Detectie:

1. Colorimetrische detectie:

De colorimetrische detectiemethode hangt af van incubatie van de Western-blot met een substraat dat reageert met het reporter-enzym (zoals peroxidase) dat aan het secundaire antilichaam is gebonden. Dit zet de oplosbare kleurstof om in een onoplosbare vorm van een andere kleur die naast het enzym neerslaat en daardoor het nitrocellulosemembraan bevlekt. De ontwikkeling van de vlek wordt dan gestopt door de oplosbare kleurstof weg te wassen. Eiwitniveaus worden geëvalueerd door middel van densitometrie (hoe intens de vlek is) of spectrofotometrie.

Chemiluminescente detectiemethoden zijn afhankelijk van incubatie van de Western-blot met een substraat dat zal oplichten wanneer het wordt blootgesteld aan de reporter op het secundaire antilichaam. Het licht wordt vervolgens gedetecteerd door fotografische film, en meer recentelijk door CCD-camera's die een digitaal beeld van de Western-blot vastleggen.

Het beeld wordt geanalyseerd door densitometrie, die de relatieve hoeveelheid eiwitkleuring evalueert en de resultaten kwantificeert in termen van optische dichtheid. Nieuwere software maakt verdere gegevensanalyse mogelijk, zoals analyse van het molecuulgewicht als de juiste standaarden worden gebruikt. De zogenaamde “enhanced chemiluminescent’8221 (ECL) detectie wordt beschouwd als een van de meest gevoelige detectiemethoden voor blotting-analyse.

3. Radioactieve detectie:

Radioactieve labels vereisen geen enzymsubstraten, maar maken het eerder mogelijk om medische röntgenfilm direct tegen de Western-blot te plaatsen die zich ontwikkelt als deze wordt blootgesteld aan het label en donkere gebieden creëert die overeenkomen met de eiwitbanden van belang (zie afbeelding bij de Rechtsaf). Het belang van radioactieve detectiemethoden neemt af, omdat het erg duur is, gezondheids- en veiligheidsrisico's groot zijn en ECL een bruikbaar alternatief biedt.

4. Fluorescerende detectie:

De fluorescent gelabelde sonde wordt geëxciteerd door licht en de emissie van de excitatie wordt vervolgens gedetecteerd door een fotosensor zoals een CCD-camera die is uitgerust met geschikte emissiefilters die een digitaal beeld van de Western-blot vastlegt en verdere gegevensanalyse mogelijk maakt, zoals analyse van het molecuulgewicht en een kwantitatieve Western-blot-analyse. Fluorescentie wordt beschouwd als een van de meest gevoelige detectiemethoden voor blotting-analyse.

Analyse:

Nadat de ongebonden sondes zijn weggewassen, is de western blot klaar voor detectie van de sondes die zijn gelabeld en gebonden aan het eiwit van belang. In praktische termen onthullen niet alle westerns eiwit alleen op één band in een membraan. Groottebenaderingen worden genomen door de gekleurde banden te vergelijken met die van de marker of ladder die tijdens elektroforese is geladen.

Het proces wordt herhaald voor een structureel eiwit, zoals actine of tubuline, dat niet mag veranderen tussen monsters. De hoeveelheid doeleiwit wordt geïndexeerd aan het structurele eiwit om tussen groepen te controleren. Deze praktijk zorgt voor correctie voor de hoeveelheid totaal eiwit op het membraan in geval van fouten of onvolledige overdrachten.

Secundaire sonderen (strippen):

Een belangrijk verschil tussen nitrocellulose- en PVDF-membranen heeft betrekking op het vermogen van elk om antilichamen te 'strippen' en het membraan opnieuw te gebruiken voor daaropvolgende antilichaamsondes. Hoewel er gevestigde protocollen beschikbaar zijn voor het strippen van nitrocellulosemembranen, zorgt de stevigere PVDF voor eenvoudiger strippen en voor meer hergebruik voordat experimenten met achtergrondgeluid worden beperkt.

Vermijd overmatig strippen van het membraan, omdat doeleiwitten tijdens langdurige incubaties uit de blot verloren kunnen gaan. Membraanscanning 9 wordt regelmatig uitgevoerd om te bepalen wanneer het strippen voltooid is. Als te veel strippen een probleem is, probeer dan de hoeveelheid SDS in de stripbuffer te verminderen.

Afhankelijk van de sterkte van de antilichaam-antigeen-interacties, moet men de striktheid van het stripprotocol optimaliseren. Een ander verschil is dat PVDF, in tegenstelling tot nitrocellulose, voor gebruik moet worden geweekt in 95% ethanol, isopropanol of methanol. PVDF-membranen zijn ook vaak dikker en beter bestand tegen beschadiging tijdens gebruik.

Medische diagnostische toepassingen:

1. De bevestigende HIV-test maakt gebruik van een Western-blot om anti-HIV-antilichamen in een menselijk serummonster te detecteren. Eiwitten van bekende met HIV geïnfecteerde cellen worden gescheiden en zoals hierboven op een membraan geblot. Vervolgens wordt het te testen serum aangebracht in de incubatiestap van het primaire antilichaam, wordt het vrije antilichaam weggewassen en wordt een secundair anti-humaan antilichaam gekoppeld aan een enzymsignaal toegevoegd. De gekleurde banden geven vervolgens de eiwitten aan waartegen het serum van de patiënt antilichaam bevat.

2. Een Western-blot wordt ook gebruikt als de definitieve test voor Boviene spongiforme encefalopathie (BSE, gewoonlijk 'gekkekoeienziekte' genoemd).


Achtergrond

Gecoördineerde genexpressie is van fundamenteel belang voor de ontwikkeling en het onderhoud van een organisme, en afwijkingen komen vaak voor bij ziekten. Bijgevolg zijn experimenten om expressie op een genoombrede schaal te meten alomtegenwoordig. Het meest gebruikelijke experiment omvat de kwantificering van de overvloed aan mRNA-transcripten, gemiddeld over een populatie van duizenden of miljoenen cellen. Deze zogenaamde traditionele of bulk-RNA-seq-experimenten zijn in een groot aantal onderzoeken nuttig gebleken. Omdat bulk-RNA-seq echter geen maatstaf voor celspecifieke expressie biedt, blijven veel belangrijke signalen onopgemerkt. Een gen dat bijvoorbeeld op een relatief constant niveau tot expressie lijkt te worden gebracht in een bulk-RNA-seq-experiment, kan in feite tot expressie worden gebracht in subgroepen van cellen op niveaus die aanzienlijk variëren (zie Fig. 1).

Schematische voorstelling van de aanwezigheid van twee celtoestanden binnen een celpopulatie die kunnen leiden tot bimodale expressieverdelingen. een Tijdreeksen van de onderliggende expressietoestand van gen X in een populatie van niet-gesynchroniseerde enkele cellen, die met middelen heen en weer schakelt tussen een lage en hoge toestand μ 1 en μ 2, respectievelijk. De kleur van cellen op elk tijdstip komt overeen met de onderliggende expressiestatus. B Populatie van individuele cellen in de schaduw van de expressietoestand van gen X op een momentopname. C Histogram van het waargenomen expressieniveau van gen X voor de celpopulatie in (B)

Single-cell RNA-seq (scRNA-seq) vergemakkelijkt de meting van genoom-brede mRNA-abundantie in individuele cellen, en biedt daardoor de mogelijkheid om de mate van genspecifieke expressie heterogeniteit binnen een biologische toestand te bestuderen, en de impact van veranderingen in omstandigheden. Dit is nodig om nieuwe celtypen te ontdekken [1, 2], om te verhelderen hoe veranderingen in genexpressie bijdragen aan ontwikkeling [3-5], om de rol van celheterogeniteit op de immuunrespons [6, 7] en kankerprogressie te begrijpen [ 6, 8-10], en voor het voorspellen van de respons op chemotherapeutische middelen [11-13]. Helaas zijn de statistische methoden die beschikbaar zijn voor het karakteriseren van genspecifieke expressie binnen een aandoening en voor het identificeren van verschillen tussen omstandigheden in scRNA-seq sterk beperkt, grotendeels omdat ze niet volledig tegemoet komen aan de cellulaire heterogeniteit die gangbaar is in eencellige gegevens.

Om genen te identificeren met expressie die varieert in biologische omstandigheden in een scRNA-seq-experiment, gebruikten een aantal vroege onderzoeken methoden van bulk-RNA-seq [4, 10, 12, 14, 15]. In het algemeen gaan de methoden ervan uit dat elk gen een latent expressieniveau heeft binnen een biologische toestand, en dat metingen rond dat niveau fluctueren als gevolg van biologische en technische bronnen van variabiliteit. Met andere woorden, ze gaan ervan uit dat genspecifieke expressie goed wordt gekenmerkt door een unimodale verdeling binnen een aandoening. Verder komen tests voor verschillen in expressie om zogenaamde differentieel tot expressie gebrachte (DE) genen te identificeren neer op tests voor verschuivingen in de unimodale distributies over omstandigheden. Een groot nadeel van deze benaderingen in de eencellige setting is dat er, vanwege zowel biologische als technische cel-tot-cel variabiliteit, vaak een overvloed aan cellen is waarvoor de expressie van een bepaald gen niet wordt waargenomen [7, 16, 17] en bijgevolg zijn unimodale distributies onvoldoende.

Om dit aan te pakken, zijn onlangs een aantal statistische methoden ontwikkeld om bimodaliteit in scRNA-seq-gegevens te accommoderen [17, 18]. In deze op mengselmodellen gebaseerde benaderingen biedt één componentdistributie ruimte voor niet-geobserveerde of uitvalmetingen (waaronder nul en, optioneel, waarnemingen met een lage magnitude) en een tweede unimodale component beschrijft genexpressie in cellen waar expressie wordt waargenomen. Hoewel deze benaderingen een vooruitgang bieden ten opzichte van unimodale modellen die in bulk worden gebruikt, zijn ze onvoldoende voor het karakteriseren van multimodale expressiegegevens, wat gebruikelijk is in scRNA-seq-experimenten (zie figuur 2).

Vergelijking van modaliteit in bulk versus enkele cellen. Staafdiagram van het aandeel genen (of transcripten) in elke dataset waarbij de log-getransformeerde niet-nul-expressiemetingen het best passen bij een 1, 2 of 3+ modus normaal mengselmodel (waar 3+ 3 of meer aanduidt). De modaliteit wordt bepaald aan de hand van een Bayesiaans informatieselectiecriterium met filtering (zie “Partitieschatting”). Rode tinten duiden bulk RNA-seq datasets, en blauwe tinten duiden eencellige datasets aan. Het nummer na elk datasetlabel geeft het aantal aanwezige monsters aan (bijv. GE.50 is een bulkdataset met 50 samples). Gegevenssets GE.50, GE.75, en GE.100 worden geconstrueerd door willekeurig 50, 75 en 100 monsters van GEUVADIS te nemen [56]. Gegevensset LC bestaat uit 77 normale monsters uit de TCGA-longadenocarcinoomstudie [57]. Voor details van de eencellige datasets, zie “Methoden”

Specifiek hebben een aantal onderzoeken aangetoond dat veel soorten heterogeniteit aanleiding kunnen geven tot meerdere expressiemodi binnen een bepaald gen [19–23]. Er zijn bijvoorbeeld vaak meerdere toestanden tussen tot expressie gebrachte genen [19, 20, 22] (een schema wordt getoond in Fig. 1). De overgang tussen celtoestanden kan voornamelijk stochastisch van aard zijn en het gevolg zijn van expressie-uitbarstingen [24, 25], of het gevolg zijn van positieve feedbacksignalen [19, 23, 26]. Naast het bestaan ​​van meerdere stabiele toestanden, kunnen er ook meerdere modi in de verdeling van expressieniveaus in een celpopulatie optreden wanneer het gen ofwel oscillerend en niet-gesynchroniseerd is, of oscillerend met cellulaire heterogeniteit in frequentie, fase en amplitude [21, 23] .

Figuur 3 illustreert gemeenschappelijke multimodale distributies binnen en tussen biologische omstandigheden. Wanneer het algehele gemiddelde expressieniveau voor een bepaald gen over de omstandigheden wordt verschoven, kunnen bulkmethoden of recente methoden voor scRNA-seq [17, 18, 27, 28] het gen mogelijk identificeren als enige verandering. Zoals we hier laten zien, zouden ze echter relatief weinig kracht hebben om dit te doen, en zouden ze de verandering niet kunnen karakteriseren, wat vaak van belang is in een scRNA-seq-experiment. Het gen in Fig. 3c toont bijvoorbeeld een differentieel aantal modi (DM), terwijl het gen in Fig. 3b een differentieel aandeel (DP) van cellen op elk expressieniveau over de omstandigheden laat zien. Het is belangrijk om onderscheid te maken tussen DM en DP, aangezien de eerste de aanwezigheid van een specifiek celtype in de ene toestand suggereert, maar niet in de andere, terwijl de laatste een verandering in splitsingspatronen tussen individuele cellen [7] of celspecifieke reacties op signalering suggereert [ 29].

Diagram van plausibele differentiële distributiepatronen (afgevlakte dichtheidshistogrammen), inclusief: een traditionele differentiële expressie (DE), B differentieel aandeel cellen binnen elke component (DP), C differentiële modaliteit (DM), en NS zowel differentiële modaliteit als verschillende componentgemiddelden binnen elke conditie (DB). DB zowel differentiële modaliteit als verschillende componentmiddelen, DE differentiële expressie, DM differentiële modaliteit, DP differentiële verhouding

Hier ontwikkelen we een Bayesiaans modelleringskader, scDD, om de karakterisering van expressie binnen een biologische toestand te vergemakkelijken en om genen te identificeren met differentiële distributies (DD's) over omstandigheden in een scRNA-seq-experiment. Een DD-gen kan worden geclassificeerd als DE, DM, DP of zowel DM als differentiële expressiemiddelen (afgekort DB). Figuur 3 geeft een overzicht van elk patroon. Simulatiestudies suggereren dat de aanpak verbeterde kracht en precisie biedt voor het identificeren van differentieel verdeelde genen. Bijkomende voordelen worden aangetoond in een case study van menselijke embryonale stamcellen (hESC's).


Functionele overspraak tussen differentieel tot expressie gebrachte en alternatief gesplitste genen in met berberine behandelde menselijke leverkankercellen

Berberine is geïdentificeerd met anti-proliferatieve effecten op verschillende kankercellen. Veel onderzoekers hebben geprobeerd de antikankermechanismen van berberine op te helderen op basis van differentieel tot expressie gebrachte genen. Differentieel alternatieve splicing-genen die door berberine worden geïnduceerd, kunnen echter ook bijdragen aan de farmacologische werking ervan en zijn nog niet gerapporteerd. Bovendien verdient de mogelijke functionele overspraak tussen de twee sets genen nader onderzoek. In deze studie werd RNA-seq-technologie gebruikt om de differentieel tot expressie gebrachte genen en differentieel alternatieve gesplitste genen in BEL-7402-kankercellen te detecteren, geïnduceerd door berberine. Functionele verrijkingsanalyse gaf aan dat deze genen voornamelijk waren verrijkt in de p53- en celcyclussignaleringsroute. Bovendien werd statistisch bewezen dat de twee sets genen lokaal co-verrijkt waren langs chromosomen, nauw met elkaar verbonden waren op basis van eiwit-eiwitinteractie en functioneel vergelijkbaar in de Gene Ontology-boom. Deze resultaten suggereerden dat de twee sets genen die door berberine worden gereguleerd, functioneel met elkaar kunnen praten en gezamenlijk kunnen bijdragen aan het remmende effect van de celcyclus. Het heeft nieuwe aanwijzingen opgeleverd voor verder onderzoek naar de farmacologische mechanismen van berberine en de andere botanische geneesmiddelen.

Belangenconflict verklaring

Concurrerende belangen: De auteurs hebben verklaard dat er geen concurrerende belangen bestaan.

Figuren

Fig 1. Vertegenwoordiging van differentieel uitgedrukt en...

Fig 1. Vertegenwoordiging van differentieel tot expressie gebrachte en alternatief gesplitste genen na behandeling met berberine.

Fig 2. Positionele co-verrijking van DEG's en ...

Fig 2. Positionele co-verrijking van DEG's en DASG's langs 24 chromosomen.

Fig 3. De PPI-nabijheid (gemiddeld kortste...

Fig 3. De PPI-nabijheid (gemiddelde kortste padafstand) tussen DEG's en DASG's.


Discussie

We stellen een statistische methode PseudotimeDE voor om DE-genen langs afgeleide celpseudotijd te identificeren. PseudotimeDE richt zich op het genereren van goed gekalibreerde P-waarden rekening houdend met de willekeur van afgeleide pseudotijd. Om deze doelen te bereiken, gebruikt PseudotimeDE eerst subsampling om de onzekerheid van pseudotijd te schatten. Ten tweede past PseudotimeDE de NB-GAM of ZINB-GAM aan op zowel de originele dataset als de gepermuteerde subsampled datasets om de teststatistiek en de geschatte nulwaarden te berekenen. Vervolgens past PseudotimeDE een parametrische verdeling aan om de geschatte nulverdeling van de teststatistiek te schatten. Ten slotte berekent PseudotimeDE P-waarden met een hoge resolutie. PseudotimeDE is flexibel om op elke manier celpseudotijd te accommoderen die in een standaardformaat is afgeleid. Het gebruik van NB-GAM en ZINB-GAM stelt het in staat om diverse genexpressiedynamieken vast te leggen en om ongewenste nul-inflatie in gegevens te accommoderen.

Uitgebreide onderzoeken naar gesimuleerde en echte gegevens bevestigen dat PseudotimeDE betere FDR-controle en meer vermogen oplevert dan vier bestaande methoden (tradeSeq, Monocle3-DE, NBAMSeq en ImpulseDE2). Op gesimuleerde gegevens genereert PseudotimeDE goed gekalibreerde P-waarden die de uniforme verdeling onder de nulhypothese volgen, terwijl bestaande methoden behalve Monocle3-DE hebben P-waarden die de uniforme aanname schenden. Goed gekalibreerd P-waarden garanderen de geldige FDR-controle van PseudotimeDE. Bovendien heeft PseudotimeDE, dankzij het gebruik van flexibele modellen NB-GAM en ZINB-GAM, een hoger vermogen dan Monocle3-DE, dat een restrictiever model GLM gebruikt en dus minder vermogen heeft. PseudotimeDE presteert ook beter dan de andere drie methoden - tradeSeq, NBAMSeq en ImpulseDE2 - die slecht gekalibreerde P-waarden in termen van macht. Op drie echte scRNA-seq-datasets omvatten de DE-genen die uniek zijn geïdentificeerd door PseudotimeDE een betere biologische interpreteerbaarheid die wordt onthuld door functionele analyses, en de P-waarden van PseudotimeDE leiden tot significantere GSEA-resultaten.

Een interessante en open vraag is welke pseudotime-inferentiemethode het beste werkt met PseudotimeDE. Hoewel we zien dat PseudotimeDE een hoger vermogen heeft met Slingshot dan met Monocle3-PI in simulatiestudies, realiseren we ons dat de reden kan worden geassocieerd met het simulatieontwerp (bijv. de afstammingsstructuren), en dus kunnen we geen conclusie trekken uit deze observatie . Vanwege de diversiteit aan biologische systemen en de complexiteit van pseudotijd-inferentie [9], besluiten we de keuze van pseudo-tijd-inferentiemethoden open te laten voor gebruikers, en dit is het voordeel dat PseudotimeDE flexibel is om afgeleide pseudo-tijd door welke methode dan ook te accommoderen. In de praktijk moedigen we gebruikers aan om populaire pseudotime-inferentiemethoden te proberen en PseudotimeDE te gebruiken als een stroomafwaartse stap om DE-genen te identificeren, zodat ze de identificatieresultaten kunnen analyseren en kunnen beslissen welke pseudotime-inferentiemethode het meest geschikt is voor hun dataset.

De nul-inflatie, of "drop-out"-kwestie, blijft verwarrend en controversieel in het eencellige veld [40-44]. De controverse gaat over de vraag of overtollige nullen die niet kunnen worden verklaard door Poisson of negatieve binominale verdelingen biologisch zinvol zijn of niet. Facing this controversy, we provide two models in PseudotimeDE: NB-GAM and ZINB-GAM, with the former treating excess zeros as biologically meaningful and the latter not. Specifically, the negative binomial distribution in NB-GAM is fitted to all gene expression counts including excess zeros, while the fitting of the negative distribution in ZINB-GAM excludes excess zeros, which ZINB-GAM implicitly treats as non-biological zeros. PseudotimeDE allows the choice between the two models to be user specified or data driven. From our data analysis, we realize that the choice often requires biological knowledge of the dataset to be analyzed. Specifically, on the LPS-dendritic cell dataset and pancreatic beta cell maturation dataset, we observe that ZINB-GAM leads to power loss: some potential DE genes cannot be identified by ZINB-GAM because zero counts contain useful information (Additional file 1: Figs. S15-S18). Our observation is consistent with another recent study [42], whose authors observed that “zero-inflated models lead to higher false-negative rates than identical non-zero-inflated models.” Hence, our real data analysis results are based on NB-GAM. However, realizing the complexity of biological systems and scRNA-seq protocols, we leave the choice between NB-GAM and ZINB-GAM as an option for users of PseudotimeDE, and we encourage users to plot their known DE genes as in Additional file 1: Figs. S15-S18 to decide which of NB-GAM and ZINB-GAM better captures the gene expression dynamics of their interest.

The current implementation of PseudotimeDE is restricted to identifying the DE genes that have expression changes within a cell lineage. While methods including GPfates [45], Monocle2 BEAM [46], and tradeSeq can test whether a gene’s expression change is associated with a branching event leading to two lineages, they do not consider the uncertainty of lineage inference. How to account for such topology uncertainty is a challenging open question, as we have seen in Figs. 2f and 6b that the inferred lineage may vary from a bifurcation topology to a trifurcation topology on different subsets of cells. A possible direction is to use the selective inference [47, 48], and we will leave the investigation of this question to future research. Due to this topology uncertainty issue, PseudotimeDE is most suitable for single-cell gene expression data that contain only one cell lineage (including cyclic data) or a small number of well separated cell lineages (e.g., bifurcation and trifurcation). The reason is that these data can maintain stable inferred cell topology after subsampling, an essential requirement of PseudotimeDE. That said, PseudotimeDE is not designed for data with many equivocal cell lineages or a complex cell hierarchy, the data that cannot maintain stable inferred cell topology across subsamples, because for such data, it is difficult to find one-to-one matches between cell lineages inferred from a subsample and those inferred from the original data. Then, a practical solution for such data is to first define a cell lineage of interest and then apply PseudotimeDE to only the cells assigned to that lineage.

There are other open questions to be explored. An important question is: when do we want to identify DE genes along pseudotime? As we have shown in the “Results” section, inferred pseudotime can be highly uncertain. As biologists often sequence cells at multiple physical time points if they want to investigate a biological process, a straightforward analysis is to identify the DE genes that have expression changes across the physical time points. Then, we have two definitions of DE genes: the genes whose expression changes across pseudotime vs. physical time. Understanding which definition is more biologically relevant is an open question. Another question is whether it is possible to integrate pseudotime with physical time to identify biologically relevant DE genes. Answering either question requires a statistical formulation that is directly connected to a biological question.

Another question is how to explore gene-gene correlations along cell pseudotime. Current DE methods only detect marginal gene expression changes but ignore gene-gene correlations. It remains unclear whether gene-gene correlations are stable or varying along cell pseudotime. Hence, a new statistical method to detect gene-gene correlation changes along inferred pseudotime may offer new biological insights into gene co-expression and regulation at the single-cell resolution.


We compared five statistical methods to detect differentially expressed genes between two distinct single-cell populations. Currently, it remains unclear whether differential expression methods developed originally for conventional bulk RNA-seq data can also be applied to single-cell RNA-seq data analysis. Our results in three diverse comparison settings showed marked differences between the different methods in terms of the number of detections as well as their sensitivity and specificity. They, however, did not reveal systematic benefits of the currently available single-cell-specific methods. Instead, our previously introduced reproducibility-optimization method showed good performance in all comparison settings without any single-cell-specific modifications.

Gene expression profiling has traditionally focused on bulk populations of millions of cells, measured either using microarrays or next-generation sequencing technologies. Although an average expression level for each gene in the cell population can be sufficient in many applications, such as determining disease biomarkers, bulk RNA-seq analysis lacks the detail of cell-specific functionality. Consequently, with the rapid technological developments, single-cell RNA-seq (scRNA-seq) has quickly grown into a popular field of RNA-sequencing, enabling novel biological discoveries such as detecting novel cell types with distinct expression signatures, or understanding of the stochasticity of gene expression in a cell population [ 1–3].

To effectively use the scRNA-seq data, it is crucial to use appropriate tools for the data analysis. Although several sophisticated methods are already available for analyzing bulk RNA-seq data [ 4–6], their direct applicability to scRNA-seq data still remains largely unclear. In particular, scRNA-seq has its own specificities and challenges, a major challenge being how to distinguish technical and biological noise. This stems, on the one hand, from the low amount of starting material and, on the other hand, from inherent biological variability [ 7]. However, the number of measurements per group is typically considerably higher in scRNA-seq experiments than in bulk RNA-seq experiments, which can, at least to some extent, compensate the higher noise levels [ 3].

A common task in many single-cell studies is to detect differentially expressed (DE) genes between cell populations. There are already multiple methods that can be used for that purpose. Some of the methods are new and designed specifically for scRNA-seq data, some have been originally developed for bulk RNA-seq data, and some are more general. Recently, Kharchenko et al. [ 7] briefly compared some of the single-cell methods with their novel method presented in the article but there still remains a lack of a systematic comparison of the currently available tools for scRNA-seq data.

To address this need, we compared five representative statistical methods that detect DE genes between single-cell populations: (1) single-cell differential expression (SCDE) [ 7], (2) model-based analysis of single-cell transcriptomics (MAST) [ 8], (3) differential expression analysis for sequence count data (DESeq) [ 9], (4) Linear models for microarray and RNA-Seq data (Limma) [ 10] and (5) reproducibility-optimized test statistic (ROTS) [ 11–13]. SCDE and MAST are specifically designed for single-cell data, DESeq and Limma are methods developed originally for conventional bulk RNA-seq data and ROTS is a general statistical method, which learns the appropriate test statistic directly from the data. To systematically assess whether the methods designed specifically for scRNA-seq data perform better than the methods developed for bulk RNA-seq data or the more general methods, three diverse comparisons were considered. The first one was similar to the one in [ 7]: there are two independent data sets including measurements from the same two cell types [ 14, 15] and the methods are expected to find the same genes as significant in both data sets. In the other two comparisons, we investigated reproducibility of the detections, false positive findings and the effect of the number of measured cells on the results using two recently published large single-cell data sets by Kowalczyk et al. [ 16] and Björklund et al. [ 17].


Resultaten

We examined for roles of Shc in regulating cell migration, because it is implicated in integrin signaling and is a prominent target of the tumor suppressor phosphatase PTEN, which is a newly identified regulator of cell migration and invasion. We find that Shc can enhance cell migration inhibited by PTEN and that Shc is a direct target for PTEN phosphatase activity. We compare this novel pathway regulating cell migration both mechanistically and biologically with the previously described FAK-p130 Cas pathway (Cary et al. 1996, Cary et al. 1998 Tamura et al. 1998) including roles in regulating speed and the directionality of cell migration.

Shc Induces Cell Migration Inhibited by PTEN

To test for a role of Shc in cell migration modulated by PTEN, we cotransfected PTEN and puromycin resistance plasmids with Shc (or FAK as a positive control), and selected transfectants for 2 d using puromycin. This puromycin selection procedure routinely yielded ∼90% pure populations of transfectants according to fluorescence analyses using GFP markers. The surviving selected cells were replated on glass microwell dishes coated with 10 μg/ml fibronectin and cultured in DME containing 10% FBS overnight. To analyze cell motility, phase-contrast video images were recorded at 20-min intervals using a CCD camera and were analyzed for velocities of cell migration using MetaMorph image processing software. As shown in Fig. 1, reconstitution of PTEN in these cells lacking PTEN to protein levels similar to those in primary fibroblasts (1–2× according to immunoblotting) substantially inhibited cell movement. Migration was reduced to 39% of rates in controls without PTEN. Interestingly, coexpression of Shc with PTEN significantly rescued rates of cell motility on fibronectin, raising them from 39% of control migration rates with PTEN alone to 78% of controls after Shc coexpression with PTEN. These differences were significant at the P < 0.001 level.

Because PTEN can downmodulate the ERK type of MAP kinase signaling, we tested whether constitutively activated MEK1, a potential downstream effector of Shc, could also activate cell movement downmodulated by PTEN (Fig. 1). MEK1 coexpression was highly effective in reversing PTEN inhibition of migration (significant at the P < 0.001 level). Consistent with previous observations that FAK and p130 Cas overexpression could rescue PTEN inhibition of cell migration measured by in vitro wound-healing assays (Tamura et al. 1999a), FAK and p130 Cas also effectively rescued single cell movement in this system (Fig. 1). To test whether Shc and FAK stimulated cell motility via different or overlapping pathways, we performed a triple transfection experiment combining PTEN with both Shc and FAK. Cell movement was fully restored to 95% of controls by this triple transfection, as compared with 78% of controls for Shc plus PTEN double transfection and 82% for FAK plus PTEN. This simple additivity of migration suggests the existence of two parallel biological pathways originating from Shc and FAK affecting cell migration modulated by PTEN. In contrast, the Y397F mutant of FAK lacking the Src and phosphatidylinositol 3′-kinase binding site did not affect migration rates (data not shown).

Dominant Negative Shc Expression Inhibits Cell Migration

As a direct test of the role of Shc in cell migration (independent of PTEN), we examined whether expression of a dominant negative mutant of Shc to block endogenous Shc function could mimic the effects of PTEN. Transfection with dominant negative Shc (double point mutant Y239/317F) substantially reduced cell migration to 58% of controls (Fig. 2). A putative integrin-specific mutant of Shc in which only tyrosine 317 was mutated (Wary et al. 1998) produced less inhibition, suggesting a roughly 40:60% ratio of contributions of integrins versus serum growth factors to Shc stimulation of migration. Specifically, there was 16% inhibition with Y317F versus 42% inhibition with the double mutant.

In addition, transfection with FRNK or dominant negative p130 Cas also substantially reduced cell migration to 55 or 54% of controls, respectively (Fig. 2). In contrast, expression of GFP (−), Shc, FAK, constitutively activated MEK1, or p130 Cas alone in the absence of PTEN had little or no effect on cell migration of U-87MG cells in this system (Fig. 2). Because it had been reported previously that FAK overexpression significantly increases CHO cell migration (Cary et al. 1996), we also compared FAK overexpression in CHO cells using our cell migration assay. We found that FAK overexpression did enhance cell migration of CHO cells in this system to 165% of controls transfected with GFP (−) alone (data not shown).

Although phosphatidylinositol 3′-kinase, an upstream regulator of PKB/Akt, has been implicated in cell movement (Keely et al. 1997 Shaw et al. 1997 Sander et al. 1998), to our knowledge there are no studies on the roles of Akt in cell movement. Because many studies indicate that PTEN inhibits cell growth and leads to apoptosis through inhibition of the PKB/Akt pathway, an obvious question is whether PTEN-mediated inhibition of Akt affects cell migration. U-87MG cells were cotransfected with the puromycin resistance plasmid pHA262pur and either wild-type Akt or dominant negative Akt, and transfected cells were selected as described above. We could not detect any significant differences in rates of cell migration between control cells and either type of transfectant affecting Akt (data not shown). Effects of PTEN on Akt are, therefore, not likely to play a role in PTEN regulation of cell migration.

Shc Interacts Physically with PTEN

Since Shc and PTEN appeared to be involved in an early step of a specific signaling pathway regulating cell migration, they might be expected to interact physically. Shc has three isoforms of 66, 52, and 46 kD, which are derived from alternative splicing and differential translation initiation at three ATG sites (Migliaccio et al. 1997). PTEN preferentially decreases tyrosine phosphorylation of the 52-kD isoform of Shc and thereby inhibits interaction with the adapter protein Grb2, resulting in decreased activation of the Ras/Raf/MEK/ERK pathway (Gu et al. 1998). Because phosphatases bind, but rapidly cleave and dissociate from substrates, we tested for physical interactions of PTEN with Shc in living cells using a trapping mutant D92A of PTEN. The latter mutant has inactivated phosphatase activity but retains its ability to bind and even to protect a substrate (Flint et al. 1997). Cells were cotransfected with control or PTEN plasmids and a puromycin resistance plasmid, and then selected with puromycin to enrich transfected cells. The surviving cells (90% positive) were cultured overnight without puromycin, and then stimulated with EGF for 5 min. Homogenates were immunoprecipitated with anti-Shc or anti-GFP followed by immunoblotting with the opposite or the same antibody.

As shown in Fig. 3 A, immunoprecipitated Shc retained substantial amounts of bound PTEN D92A trapping mutant. It also retained, to a lesser extent, the direct active site PTEN mutant C124A. But in cells transfected with control plasmid GFP (−) or wild-type GFP-PTEN, such associations with Shc could not be detected. Conversely, immunoprecipitation of the GFP-PTEN mutant D92A with anti-GFP antibody also retained Shc bound in higher quantities as compared with cells expressing the C124A mutant or wild-type PTEN (Fig. 3 B). These results using a substrate-trapping mutant strongly suggest that PTEN directly interacts with Shc. PTEN associated selectively with the 52-kD isoform of Shc (Fig. 3 B), which is consistent with the higher tyrosine phosphorylation of this 52-kD isoform. Similar but much weaker binding of the D92A PTEN trapping mutant to Shc was observed even in the absence of stimulation by EGF with minimal binding of wild-type or C124A mutant PTEN (data not shown).

PTEN Directly Dephosphorylates Shc

Next, we tested whether PTEN could directly dephosphorylate Shc using two types of in vitro phosphatase assays. An in blot phosphatase assay was used to examine the tyrosine-phosphorylated 52-kD isoform of Shc as a direct substrate of PTEN. FAK was used as a positive control (Tamura et al. 1998) and activated ERK2 as a negative control (Myers et al. 1997). Renatured recombinant PTEN reduced the tyrosine phosphorylation of the electroblotted 52-kD Shc by 67% (Fig. 4 A, lane 2, top) compared with controls to which we added 2 mM sodium vanadate, a general inhibitor of phosphatase activity (lane 1). This level of dephosphorylation of Shc was similar to the 70% reduction in tyrosine phosphorylation of FAK. In contrast, PTEN could not dephosphorylate activated ERK2 in vitro (Fig. 4 A, lane 2, bottom) the latter negative result was consistent with a previous report using a different assay system (Myers et al. 1997).

We also tested whether PTEN could dephosphorylate native tyrosine–phosphorylated Shc in vitro. Incubation of recombinant PTEN with immunoprecipitated endogenous Shc showed that PTEN could dephosphorylate all three isoforms of Shc (Fig. 4 B). PTEN appeared to dephosphorylate both of the two major tyrosine phosphorylation sites because it equally effectively removed phosphotyrosine from mutant p52Shc molecules containing only one of the two sites after point mutations to phenylalanine in the Y239F or Y317F mutants (Fig. 4 C). The double point mutant Y239/317F Shc showed only very weak phosphorylation stimulated by EGF (data not shown), confirming that tyrosines 239 and 317 were the two major sites for phosphorylation.

Shc Overexpression Rescues Integrin-mediated MAP Kinase Activation Impaired by PTEN

The possible mechanisms of Shc regulation of PTEN-modulated adhesion were explored in more detail. We tested whether overexpression of Shc or FAK could attenuate the effects of PTEN on MAP kinase activation by fibronectin. We cotransfected GFP-PTEN and puromycin resistance plasmids with or without Shc or FAK, or with both Shc and FAK, and selected for transfectants using puromycin. The surviving selected cells were plated for 10 min on dishes coated with fibronectin, and then homogenized using lysis buffer. MAP kinase activation was assayed by direct examination of ERK1/2 phosphorylation by immunoblotting with anti–phospho-ERK1/2. MAP kinase activation was substantially suppressed in cells transfected with PTEN alone, as described previously (Gu et al. 1998) (Fig. 5 A, increases of only 1.2–1.3-fold after plating on fibronectin). However, co-overexpression of PTEN with Shc resulted in an increase of MAP kinase activation by 2.9-fold 10 min after plating on a fibronectin substrate compared with levels in cells maintained in suspension (Fig. 5 A). In comparison, control cells transfected with GFP (−) alone (no GFP-PTEN) showed a similar 2.5-fold increase in ERK activation after fibronectin stimulation (data not shown).

The changes in MAP kinase activation accompanying overexpression of Shc in PTEN-reconstituted cells were associated with increases in Shc tyrosine phosphorylation as shown in Fig. 5 B. In contrast, overexpression of FAK produced little or no change in Shc tyrosine phosphorylation (Fig. 5 B), even though it substantially enhanced FAK phosphorylation (Fig. 6 A). These results in U-87MG cells differ from findings in 293 cells in which FAK overexpression produced elevated Shc phosphorylation and MAP kinase activation (Schlaepfer and Hunter 1997 Schlaepfer et al. 1998). We confirmed that transfection of FAK in 293 cells indeed produced elevated Shc phosphorylation (twofold) and MAP kinase activation however, the levels of overexpression differed markedly in the two cell systems, with a two to threefold increase in total FAK levels in U-87MG cells and >10-fold increases in 293 cells, which may account for the differences (Fig. 5 and Fig. 6, and data not shown).

Shc Overexpression Does Not Affect FAK and p130 Cas Phosphorylation

The activation of integrins by cell binding to extracellular matrix leads to increases in both Shc and FAK phosphorylation and enhances signaling pathways. We tested for possible overlaps between the Shc and FAK pathways by examining for effects of Shc overexpression on the FAK-p130 Cas activation pathway by comparing FAK and p130 Cas phosphorylation levels in U-87MG cells cotransfected with PTEN and Shc or FAK. As shown in Fig. 6 A, Shc overexpression did not increase FAK phosphorylation, which remained at levels similar to controls transfected with PTEN alone in contrast, FAK overexpression clearly enhanced FAK phosphorylation as previously reported (Tamura et al. 1999a). Examining downstream p130 Cas phosphorylation, FAK overexpression substantially enhanced p130 Cas phosphorylation but Shc overexpression could not (Fig. 6 B). These results support the hypothesis that two separate pathways originating from Shc or from FAK are downregulated by PTEN.

Shc and FAK Regulate Cell Migration via Distinct Pathways

Cell migration was measured by time-lapse video microscopy and tracking of patterns of motility. Fig. 7 A, a, shows a representative set of motility records of U-87MG cells. PTEN inhibited movement of individual cells (Fig. 7 A, b), which is consistent with previous results (Tamura et al. 1999a). Unexpectedly, we found that Shc and FAK each regulated cell movement in a different manner. In cells cotransfected with Shc and PTEN, the cells moved more rapidly but in random directions with a relatively limited number of runs that persisted in the same direction (Fig. 7 A, c). In contrast, in cells cotransfected with FAK and PTEN, the cells tended to continue to migrate in a particular direction, i.e., persistent movement (Fig. 7 A, d).

To quantify these differences in migration patterns, we compared the ratios of the shortest direct distance from the starting point of each recording to the end point (D), to the total distance traversed by the cell (T). For ease of comparisons, the ratio D/T was normalized to a value of 1.0 for cells transfected with PTEN alone. As shown in Fig. 7 B, cotransfection of Shc with PTEN substantially reduced the ratio to 54% compared with controls transfected with PTEN alone. However, cotransfection by PTEN with FAK significantly increased the D/T value by 1.75-fold over controls transfected with PTEN alone. Interestingly, cotransfection of both Shc and FAK with PTEN resulted in an apparent reconstitution to a ratio characteristic of nontransfected cells (Fig. 7 B): the ratio was ∼1.25-fold higher than with PTEN alone, which represented restoration of the original ratio observed in control cells transfected with GFP (−) vector alone (i.e., no PTEN, Shc, or FAK transfection). The differences between the triple transfection (PTEN, Shc, and FAK) and double transfections (PTEN and Shc or PTEN and FAK) were significant at the P < 0.0005 and P < 0.001 levels, respectively. Furthermore, overexpression of constitutively activated MEK1 to enhance MAP kinase activation mimicked the actions of Shc and reduced the ratio as shown in Fig. 7 B. In contrast, overexpression of p130 Cas produced effects similar to FAK and increased the ratio. Finally, even though transfection of cells with the dominant negative Shc construct reduced the speed of cell migration (Fig. 2), it resulted in a 1.5-fold increase in the D/T ratio (data not shown). These results strongly suggest that PTEN inhibits cell movement through at least two different pathways, i.e., Shc–MAP kinase and FAK-p130 Cas .

To confirm random versus directional cell motility, we used a mean square displacement assay (Gail 1973). Net displacements (D) of cells from their location at time zero of video time-lapse microscopy was determined every 40 min and the mean square displacement (D 2 ) was calculated and plotted against time as shown in Fig. 7 C. In pure random movement, the plot would be a straight line passing through the origin. The x-intercept for Shc was much closer to the origin than the intercept for FAK, indicating that Shc promotes relatively random movement, whereas FAK promotes considerably more directional migration.

Additional Evidence for Separate Shc and FAK Pathways

Overexpression of FAK in U-87MG cells did not significantly increase the level of tyrosine phosphorylation of Shc (Fig. 5 B) even though total phosphorylated FAK was considerably increased (Fig. 6 A). Dominant negative (dominant interfering) mutants of FAK, Cas, and Shc were used to test further the extent of separation of FAK and Shc pathways regulating migratory speed or directionality. U-87MG cells were cotransfected with PTEN to suppress migration, and then Shc or FAK cotransfectants were probed for specificity of each pathway using dominant negative FAK (the truncated version of FAK termed FRNK), dominant negative Cas (missing the substrate domain), or dominant negative Shc (Y239/317F). There were no significant effects of FRNK and dominant negative Cas on Shc-promoted cell motility: overexpression of Shc in PTEN-transfected cells plus FRNK or dominant interfering Cas cotransfection produced minimal effects on cell motility (Table). Furthermore, D/T ratios were also only minimally affected compared with parallel transfectants without FRNK or dominant interfering Cas (Table).

Conversely, dominant negative Shc cotransfected with FAK or p130 Cas also resulted in minimal effects on either rates of cell motility or the increase of D/T ratios dependent on the FAK pathway (Table). These results reveal only minimal effects of Shc on the FAK-p130 Cas pathway, whereas the same dominant negative Shc construct had substantial effects on migration when both putative pathways were active (Fig. 2).

Additional evidence for differences between the FAK and Shc pathways was provided by the use of MEK and phosphatidylinositol 3′-kinase inhibitors. The specific MEK inhibitor PD98059 abolished the increase in cell migration dependent on Shc (cells reconstituted with PTEN and cotransfected with Shc), producing a 96% reduction in cell motility compared with untreated controls (Table). In clear contrast, there was no significant inhibition (10%) of cell migration by PD98059 in parallel cells cotransfected with FAK and PTEN (Table). Furthermore, the phosphatidylinositol 3′-kinase inhibitor wortmannin substantially inhibited cell migration activated by FAK overexpression, producing a 65% reduction in rates of FAK-induced cell motility (Table). A very recent report describes a similar inhibition by phosphatidylinositol 3′-kinase inhibitors of migration enhanced by FAK overexpression in CHO cells (80% inhibition Reiske et al. 1999). In contrast, wortmannin had much less effect on our Shc-overexpressing cells, with a modest 23% decrease in the increased migration because of Shc.

Since a FAK-independent Src family kinase pathway has been described for the tyrosine phosphorylation of Shc (Sieg et al. 1998 Wary et al. 1998), we examined for possible effects of Src-related kinase activity on migration in these cells. Inhibition of function of Src kinases by the use of Csk overexpression had minimal inhibitory effects on the FAK pathway (FAK-overexpressing cells), with migration rates of 117 ± 24 μm/3 h in controls compared with 105 ± 25 μm/3 h in Csk-overexpressing cells there were no detectable effects of Csk overexpression on Shc-enhanced motility. In these experiments, Csk transfection resulted in a 7-fold increase in Csk protein by Western blotting and a 2.5-fold enhancement of Src tyrosine phosphorylation, but no evidence for significant roles of Src in regulating migration of these cells could be demonstrated.

FRNK and Dominant Negative p130 Cas Inhibit the Directionally Persistent Component of Movement Remaining in the Absence of Serum

To evaluate the contribution of growth factor stimulation to the Shc pathway stimulated by integrin ligation (as in Fig. 5B), we measured cell movements in the absence of FBS. Cell migration rates were reduced to ∼64% of controls in the presence of serum and the directionality of migration of the cells became markedly persistent in serum-free medium, as shown in Fig. 8 A (Ctr). Consistent with the prediction that this residual directional component of migration would be FAK-dependent, transfection by the FAK dominant negative construct termed FRNK or by dominant negative Cas resulted in inhibition of migration (Fig. 8a and Fig. B, FRNK and Dn-Cas [Dn-p130 Cas ]). The differences between transfection with vector alone (Ctr) and transfection with FRNK or dominant negative Cas were significant at the P < 0.0001 level. Moreover, overexpression of FRNK or dominant negative Cas also substantially reduced the directionality of migration, as indicated by a decrease in D/T ratios, which was also significant at the P < 0.0001 level.

In contrast, transfection with dominant negative Shc had only minor effects on this FAK-dependent form of cell motility (Fig. 8, A–C). Taken together, these findings in Fig. 5 and Fig. 8 suggest that the Shc pathway in U-87MG cells involves both integrins and growth factors for Shc phosphorylation and its downstream effects, and that there are at least two distinct pathways regulating cell motility. These findings appear to be consistent with a previous report that Ras signaling (presumably including MAP kinase signaling) is involved in cell migration stimulated by PDGF (Kundra et al. 1994), yet cells expressing dominant negative Ras were still able to migrate on fibronectin (Kundra et al. 1995), which could have been due to involvement of the FAK-p130 Cas pathway.

Shc and FAK Overexpression Have Different Effects on Actin Cytoskeleton and Focal Adhesions

Our previous studies had indicated that PTEN affects cell migration and invasion on fibronectin and had shown that FAK or p130 Cas could rescue these functions (Tamura et al. 1999a). Moreover, transfection of constitutively activated MEK1 to induce MAP kinase activity could partially rescue cell spreading impaired by PTEN (Gu et al. 1998). In this study, Shc was found to enhance PTEN-downmodulated actin cytoskeletal organization (Fig. 9 A, P + Shc), but the actin microfilament bundles tended to be shorter than in control cells transfected with GFP tag only (Fig. 9 A, Ctr) with interrupted patterns of rhodamine-phalloidin staining. These Shc-transfected cells showed increased numbers of focal adhesions (Fig. 9 B, P + Shc), but not to the extent seen in control cells (Fig. 9 B, Ctr). Activated MEK1 produced similar patterns of partially enhanced actin microfilament organization (Fig. 9 A, P + Mek) that were not organized to the level of control cells. As reported above, both transfectants showed enhanced random motility.

In contrast, FAK-cotransfected cells showed relatively complete restoration of extensive and oriented patterns of actin microfilament bundles (Fig. 9 A, P + FAK) with extensive focal adhesions (Fig. 9 B, P + FAK) as detected by antipaxillin staining. Cells transfected with p130 Cas , which also showed enhanced directional migration, also showed strongly organized actin cytoskeleton (Fig. 9 A, P + Cas) as well as well organized focal contacts (Fig. 9 B, P + Cas). These results establish distinct effects of Shc and FAK pathways on the actin cytoskeleton and focal adhesions, both of which are downmodulated by PTEN.

To quantify these apparent differences in morphological effects of signaling by FAK and Shc pathways, we applied a semi-quantitative morphometric measure for actin microfilament orientation that involves sampling and scoring a site within each quadrant of the cell for local actin filament orientation (see Materials and Methods). This actin orientation index confirmed the restoration of a striking degree of actin microfilament orientation in FAK- or p130 Cas -overexpressing PTEN transfectant cells, as opposed to the relatively random organization of short actin filaments in Shc- and activated MEK1-overexpressing cells (Fig. 10, left). We also counted total numbers of focal adhesions in each cell and found that Shc and activated MEK1 had a lesser but significant ability to rescue focal adhesion formation downregulated by PTEN as compared with FAK and p130 Cas (Fig. 10, right).


Dankbetuigingen

We would like to thank the authors of the BASiCS and scDD packages for their responses to our questions about how to include their simulations in Splatter as well as Mark Robinson and Charlotte Soneson for discussions regarding the simulation of scRNA-seq data. Our thanks also to Jovana Maksimovic and Sarah Blood for their comments on the manuscript.

Financiering

Luke Zappia is supported by an Australian Government Research Training Program (RTP) Scholarship. Alicia Oshlack is supported through a National Health and Medical Research Council Career Development Fellowship APP1126157. MCRI is supported by the Victorian Government's Operational Infrastructure Support Program.

Beschikbaarheid van gegevens en materialen

The datasets analyzed during the current study are available from the repositories specified in the methods. The code used to analyze them is available under an MIT license from the repository for this paper https://github.com/Oshlack/splatter-paper (doi: 10.5281/zenodo.833571). Copies of the datasets are also provided in this repository. The Splatter package is available from Bioconductor (http://bioconductor.org/packages/splatter/) and is being developed on Github (https://github.com/Oshlack/splatter) under a GPL-3 license. The specific version of Splatter used in this paper, which includes the BASiCS simulation, is available at https://github.com/Oshlack/splatter/releases/tag/v1.1.3-basics (doi: 10.5281/zenodo.833574).


Dankbetuigingen

We thank Prof. Yoshio Koyanagi and the members of the Lab. of Systems Virology (Kyoto University), the Lab. of Functional Analysis in silico (Tokyo University), Dr. Yutaro Kumagai (National Institute of Advanced Industrial Science and Technology) and Prof. Wataru Fujibuchi (Kyoto University) for helpful discussions and advice, Tianyu Wang (University of Connecticut) for assistance with DEG prediction scripts in R, and Prof. Daron Standley (Osaka University) and John Rozewicki (Osaka University) for access to the Sysimm computer cluster. This work was supported by an Office of Directors’ Research Grant provided by the Institute for Frontier Life and Medical Sciences (Kyoto University), and by the Future Development Funding Program of the Kyoto University Research Coordination Alliance.


Beschikbaarheid van data

An R package implementation of DA-seq is freely available at GitHub, https://github.com/KlugerLab/DAseq. Scripts to reproduce the analysis and figures presented in this paper are available at GitHub, https://github.com/KlugerLab/DAseq-paper.

Previously published data were used for this work. [All scRNA-seq datasets used in this manuscript are publicly available. Details are as follows. Sade-Feldman et al. (7), GSE120575 Gupta et al.(16), GSE122043 Fan et al. (27), GSE102086 Chua et al. (5), https://ndownloader.figshare.com/files/22927382 Liao et al. (6), cells.ucsc.edu/covid19-balf/nCoV.rds and Ximerakis et al. (17), https://singlecell.broadinstitute.org/single_cell/study/SCP263/aging-mouse-brain#/.]