Informatie

Wat is het verschil tussen differentieel tot expressie gebrachte genen en gedereguleerde genen?


Kan iemand duidelijk uitleggen wat het verschil is tussen differentieel tot expressie gebrachte genen en gedereguleerde genen?


Elk gen waarvan de genexpressie significant verschilt van een referentie wordt geacht differentieel tot expressie te worden gebracht. Ik denk dat de meest voorkomende weergave van differentiële expressie de vulkaanplot is, waar je de vouwverandering of log2-voudige verandering uitzet tegen de -log10 p-waarde die aan dat gen is toegewezen.

Dit betekent een paar dingen: Ten eerste heb je een voldoende grote steekproefomvang nodig die je echt kunt krijgen statistieken, en twee, je hebt een voldoende referentiemonster nodig dat als je basislijn zal dienen.

Als een gen echter gedereguleerd is, is de expressie afwijkend. Om afwijkende expressie te karakteriseren heb je een normaal monster of geaccepteerd referentiemonster, en het monster van belang. Dit kan zo simpel zijn als tumor versus normaal weefsel van dezelfde patiënt.


Differentieel tot expressie gebrachte genen bij uitgezaaide gevorderde Egyptische blaaskanker

Achtergrond: Blaaskanker is wereldwijd een van de meest voorkomende kankers. Genexpressieprofilering met behulp van microarray-technologieën verbetert het begrip van kankerbiologie. Het doel van deze studie was om het genexpressieprofiel bij Egyptische blaaskankerpatiënten te bepalen.

Materialen en methodes: Monsters van 29 menselijke blaaskankers en aangrenzende niet-neoplastische weefsels werden geanalyseerd door cDNA-microarray, met hiërarchische clustering en multidimensionale analyse.

Resultaten: Vijfhonderdzestien genen werden differentieel tot expressie gebracht, waarvan SOS1, HDAC2, PLXNC1, GTSE1, ULK2, IRS2, ABCA12, TOP3A, HES1 en SRP68 genen betrokken waren bij 33 verschillende routes. De meest frequent gedetecteerde genen waren: SOS1 in 20 verschillende routes HDAC2 in 5 verschillende routes IRS2 in 3 verschillende routes. Er waren 388 neerwaarts gereguleerde genen. PLCB2 was betrokken bij 11 verschillende routes, MDM2 in 9 routes, FZD4 in 5 routes, p15 en FGF12 in 4 routes, POLE2 in 3 routes en MCM4 en POLR2E in 2 routes. Dertig genen toonden significante verschillen tussen transitionele celkanker (TCC) en plaveiselcelkanker (SCC) monsters. Ongecontroleerde clusteranalyse van DNA-microarraygegevens onthulde een duidelijk onderscheid tussen laaggradige en hooggradige tumoren. Bovendien vertoonden 26 genen significante verschillen tussen lage en hoge tumorstadia, waaronder fragiele histidinetriade, Ras en sialyltransferase 8 (alfa) en 16 vertoonden significante verschillen tussen lage en hoge tumorgraden, zoals methionine-adenosyltransferase II, bèta.

conclusies: De huidige studie identificeerde enkele genen die kunnen worden gebruikt als moleculaire biomarkers of doelwitgenen bij Egyptische blaaskankerpatiënten.


Materiaal en methoden

Microarray-gegevens

De microarray-datasets, GSE68004, GSE73464 en GSE18606, zijn in augustus 2020 gedownload van de Gene Expression Omnibus (GEO, http://www.ncbi.nlm.nih.gov/geo/). De GSE68004-dataset (GPL10558, Illumina HumanHT −12 V4.0 expression beadchip) bevatte 89 bloedmonsters verzameld van 76 pediatrische patiënten met volledige KD, 13 pediatrische patiënten met onvolledige KD en 37 bloedmonsters van gezonde controles op leeftijd en geslacht. De GSE73464-dataset bestond uit 839 monsters, waaronder 55 monsters van gezonde controles en 78 monsters van patiënten met KD. De GSE18606-dataset werd gedownload en 48 bloedmonsters van negen gezonde controles en 20 KD-patiënten (acht IVIG niet-reagerende en 12 IVIG-reagerende patiënten) in de acute en herstellende stadia. De GSE68004- en GSE73464-datasets werden gebruikt om DElncRNA's en DEG's te screenen en de GSE18606-dataset werd gebruikt om de expressieprofilering te valideren.

Gegevensverwerking

De niet-genormaliseerde onbewerkte gegevens werden gedownload en verwerkt met behulp van het Limma-pakket (Smyth, 2005). De expressieniveaus van op de achtergrond gecorrigeerde en genormaliseerde probes werden berekend. Probes die zijn toegewezen aan menselijke mRNA's en lncRNA's in het menselijke GRCh38-referentiegenoom werden behouden, anders werden ze verwijderd. In het geval van meerdere probes die zijn toegewezen aan één mRNA of lncRNA, werd de gemiddelde expressiewaarde van de probes berekend en beschouwd als het expressieniveau van dat mRNA of lncRNA.

Analyse van differentiële expressie

De DEG's en DElncRNA's in de KD-monsters werden gescreend met behulp van de GEO2R-analysetool (//www.ncbi.nlm.nih.gov/geo/geo2r/). Significante DEG's en DElncRNA's werden geïdentificeerd met behulp van de criteria van: P waarde <0.05 en —log2(vouwwissel, FC)—≥1. DEG's en DElncRNA's met log2FC ≥1 werd opgereguleerd en log2FC ≤ − 1 werd respectievelijk gedownreguleerd. Gemeenschappelijke DEG's tussen de GSE68004- en GSE73464-datasets werden behouden en gebruikt voor verdere analyse.

Identificatie van KD-gerelateerde genendatabases

De Comparative Toxicogenomics Database (CTD, update 2019 http://ctdbase.org/) is een vooraanstaande openbare bron die bestaat uit op literatuur gebaseerde en handmatig samengestelde associaties tussen ziekten, genen, paden en chemicaliën (Davis et al., 2019). KD-gerelateerde genen en Kyoto Encyclopedia of Genes and Genomes (KEGG)-routes werden geïdentificeerd uit de CTD-database met behulp van het zoekwoord "mucocutaan lymfekliersyndroom". De genen en paden die overlapten tussen DEG's en items in de CTD-database werden behouden.

Constructie van het eiwit-eiwit interactie (PPI) netwerk

De eiwitinteractieparen werden geïdentificeerd in de STRING-database (versie 11.0, https://string-db.org/cgi/input.pl) met een score >0.4. Het PPI-netwerk werd geconstrueerd met behulp van de Cytoscape-software (versie 3.8.0 https://cytoscape.org/) en netwerkmodules werden geïdentificeerd met behulp van de Molecular Complex Detection (MCODE)-plug-in van Cytoscape.

Functionele verrijkingsanalyse

De annotatie van biologische processen van Gene Ontology en KEGG-routes presenteert de biologische eigenschappen van DEG's. Gene Ontology biologische processen en KEGG-routes gerelateerd aan DEG's werden geïdentificeerd met behulp van de database voor annotatie, visualisatie en geïntegreerde ontdekking (DAVID, versie 6.7 https://david.ncifcrf.gov/) in deze studie. Significante verrijking werd vastgesteld toen de aangepaste (BH-correctie) P waarde was <0,05.

Identificatie van KD-gerelateerde miRNA's

miRNA's gerelateerd aan DEG's in KD werden doorzocht in de miRWalk (//mirwalk.umm.uni-heidelberg.de/), miRTarbase (//mirtarbase.cuhk.edu.cn/php/index.php), en starBase (versie 2.0 https://www.starbaserobins.org/our-programs/starbase-2-0/) databases. De miRNA-mRNA-paren geïdentificeerd uit ten minste twee databases werden behouden en gebruikt om het miRNA-mRNA-regulerende netwerk te construeren.

Constructie van het lncRNA-miRNA-mRNA ceRNA-netwerk

De miRNA-lncRNA-paren werden verkregen uit de miRcode (//www.mircode.org/), DIANA-LncBase v2 (//carolina.imis.athena-innovation.gr/diana_tools/web/index.php? r=lncbasev2%2Findex-experimental), en starBase (versie 2.0 https://www.starbaserobins.org/our-programs/starbase-2-0/) databases. LncRNA-miRNA-paren die in ten minste twee databases waren opgenomen, werden bewaard en gebruikt voor de constructie van het lncRNA-miRNA-netwerk. De ceRNA-netwerken werden vervolgens geconstrueerd met behulp van de Cytoscape-software.

Functionele clustering van de belangrijkste items

GeneCLiP 3.0 (http://ci.smu.edu.cn/genclip3/analysis.php) is een webgebaseerde database voor literatuuronderzoek die de functionele clustering van potentiële kandidaten biedt. De hub DEG's en DElncRNA's in de ceRNA-netwerken werden onderworpen aan GeneCLiP3.0. De heatmap van functionele clustering werd verkregen met de criteria van P < 0,01 en druk op ≥ 4.


Knockdown van het differentieel tot expressie gebrachte gen TNFRSF12A remt de proliferatie en migratie van hepatocellulaire carcinoomcellen in vitro

Van humaan hepatocellulair carcinoom (HCC) is gemeld dat het zeer ongevoelig is voor conventionele chemotherapie. In de huidige studie werd de Agilent Whole Human Genome Oligo Microarray (4x44 K) gebruikt om de differentieel tot expressie gebrachte genen tussen HCC en aangrenzende weefsels te identificeren, en de top 22 differentieel tot expressie gebrachte genen werden bevestigd door middel van reverse transcriptie-kwantitatieve polymerasekettingreactie. Van de geïdentificeerde verschillen in genexpressie was de expressie van tumornecrosefactorreceptor-superfamilielid 12A (TNFRSF12A) opmerkelijk hoger in HCC-weefsel dan in aangrenzend weefsel. Eerdere studies hebben gesuggereerd dat TNFRSF12A een rol kan spelen bij tumorgroei en metastase, dus in de huidige studie werd TNFRSF12A neergeslagen in de SMMC7721-cellijn via siRNA. Dit toonde aan dat cellen ex vivo verminderde reproductieve en metastatische capaciteit vertoonden. De resultaten van de huidige studie suggereren dus dat TNFRSF12A een kandidaat-therapeutisch doelwit kan zijn voor kanker, waaronder HCC, en aanvullende genen die significant verschillende expressie vertoonden van normale aangrenzende weefsels, vereisen verder onderzoek.

Figuren

De heatmap en GO-analyse…

De heatmap en GO-analyse tussen HCC en aangrenzend weefsel. (A) Clusterresultaten...

Genexpressieniveaus tussen HCC...

Genexpressieniveaus tussen HCC en aangrenzend weefsel. (A) Hiërarchische clustering en warmte...

TNFRSF12A knockdown kan SMMC7721 verminderen...

TNFRSF12A knockdown kan de levensvatbaarheid van SMMC7721-cellen verminderen. (A) TNFRSF12A-expressie gedetecteerd in SMMC7721 ...

Effect van TNFRSF12A knockdown op...

Effect van TNFRSF12A-knockdown op migratie en invasie van SMMC7721-cellen. (A) Kwantitatief...


Discussie

Ondanks grote therapeutische vooruitgang is CLL nog steeds een ongeneeslijke ziekte. CLL-cellen zijn afhankelijk van micro-omgevingsoverspraak voor hun verlengde overleving in vivo, wat duidelijk wordt door de inductie van spontane apoptose wanneer CLL-cellen worden gekweekt in vitro zonder micro-omgevingsondersteuning (Collins et al, 1989 ). Daarom is karakterisering van de interactie tussen CLL-cellen en hun micro-omgeving absoluut noodzakelijk om potentiële punten van therapeutische interventie te identificeren.

Groeiend bewijs suggereert dat verschillende soorten ondersteunende cellen bijdragen aan de verlengde overleving en chemoresistentie van CLL-cellen, waaronder NLC's (Burger et al, 2000 Kurtova et al, 2009 ). CLL-cellen induceren CD14 + PBMC's om te differentiëren in NLC's wanneer ze worden gekweekt in vitro, met niet-kwaadaardige CD14+-cellen afkomstig van ofwel CLL-patiënten ofwel van gezonde probands. De huidige studie was gericht op het identificeren van de effecten die specifiek worden veroorzaakt door CLL-cellen, zowel van patiënten met gemuteerde als niet-gemuteerde IGHV status, die correleerde met expressie van ZAP70-eiwit (Tabel S1). CD14CLL-cellen en NLC's werden vergeleken met cellen die voortkwamen uit co-cultuur met niet-kwaadaardige B-cellen (CD14B-cellen). Interessant is dat we onlangs ontdekten dat CD14B-cellen hielpen ook niet-kwaadaardige B-cellen om te overleven en vertoonden geen significante verschillen in de expressieniveaus van de overlevingsgenen TNFSF13, TNFSF13B, en PECAM1 (Bhattacharya et al, 2011 ). Dit suggereert dat de belangrijkste CLL-specifieke verschillen niet noodzakelijk worden gevonden in anti-apoptotische ondersteuning, maar eerder in verschillende cellulaire routes.

Om deze CLL-specifieke verschillen te identificeren, zijn globale genexpressieprofielen van NLC's, CD14CLL-cellen en CD14B-cellen werden vergeleken. CD14CLL-cellen/NLC's vertoonden CLL-specifieke genexpressie in vergelijking met CD14B-cellen, het meest significant in de antigeenpresentatieroute (Tabel S3). Bovendien nemen de gedereguleerde genen deel aan de regulatie van zowel aangeboren als verworven immuniteit (figuur 4). Aangeboren immuniteit biedt een eerste verdedigingslinie tegen micro-organismen. Deze micro-organismen zijn bedekt met opsonine-achtige immunoglobulinen die interageren met specifieke receptoren op het oppervlak van fagocyten. Een belangrijke familie van deze receptoren zijn de Fc-receptoren (FcR's) die binden aan het Fc-gedeelte van immunoglobulinen, waardoor de vorming van het fagosoom wordt geïnduceerd (García-García & Rosales, 2002). FCGR2B (low affinity immunoglobuline gamma Fc region receptor Iib, FCGR2B) is een belangrijke remmende Fc-gamma-receptor die aanwezig is op macrofagen en onrijpe dendritische cellen die het proces van internalisatie neerwaarts reguleert (Joshi et al, 2006 ). Genexpressie niveaus van FCGR2B waren significant opgereguleerd in NLC's in vergelijking met CD14B-cellen, wat erop zou kunnen wijzen dat het fagocytotische vermogen van NLC's is aangetast. Geïnternaliseerde pathogenen worden vervolgens afgebroken in lysosomen die lysozym bevatten. In vergelijking met CD14B-cellen, NLC's hadden lagere expressieniveaus van het lysozym-gen LYZ, wat wijst op een verminderde functionaliteit van lysosomen na interactie met CLL-cellen.

Schematische weergave van de functionele rol van genen die specifiek gedereguleerd zijn in CD14+-cellen na kweken met CLL-cellen in vergelijking met kweken met niet-kwaadaardige B-cellen. Exogene pathogene deeltjes die moeten worden geendocyteerd, worden geopsoniseerd met IgG's. Deze geopsoniseerde deeltjes interageren met Fc-receptoren om het proces van internalisatie te beginnen. FCGR2B is een remmende Fc-receptor die het proces van endocytose neerwaarts reguleert. Exogene antigenen worden vervolgens verwerkt in reeksen endocytische blaasjes met enzymen, waaronder lysozym, die het pathogeen verteren en de pathogene deeltjes verwerken tot peptiden, die de HLA klasse II-route binnengaan. De HLA klasse II-moleculen worden geladen met het antigeen na vervanging van de CLIP (CD74). Peptide-HLA II-complexen worden vervolgens op het oppervlak van de cel aan T-cellen gepresenteerd. Effen zwarte pijlen tonen deregulering in NLC's in vergelijking met CD14 + -cellen gekweekt met niet-kwaadaardige B-cellen.

Antigeenverwerking via de HLA klasse II-route begint met de binding van de invariante keten (CD74) aan nieuw gesynthetiseerde HLA-moleculen in het endoplasmatisch reticulum. CD74 blokkeert de binding van peptiden tijdens het transport van het HLA klasse II-molecuul naar verzuurde endocytische blaasjes, waar pathogeen-afgeleide peptiden kunnen binden. HLA-DRA, het meest tot expressie gebrachte HLA klasse II-gen bij mensen (Schwiebert et al, 1997 ), en het invariante ketengen CD74 waren lager in expressie in NLC's in vergelijking met CD14B-cellen, wat zou kunnen wijzen op een verminderd vermogen om antigeen te presenteren. Interessant is dat CLL-patiënten die worden behandeld met op fludarabine gebaseerde regimes vatbaar zijn voor bacteriële infecties, waaronder opportunistische pathogenen zoals mycobacteriën (Puccio et al, 1991 ). Mycobacteriën overleven in intracellulaire membraangebonden blaasjes, die niet fuseren met lysosomen en daarom niet worden afgebroken door lysosomale enzymen. In deze gevallen presenteren macrofagen antigene peptiden aan type 1 T-helper (TH1) cellen via de HLA klasse II antigeenpresentatieroute, en deze cellen activeren macrofagen om de fusie van intracellulaire blaasjes met mycobacteriën met lysosomen mogelijk te maken. Evenzo, wanneer een pathogeen wordt ingenomen door onrijpe dendritische cellen, rijpen deze cellen tot zeer effectieve antigeenpresenterende cellen die naïeve T-lymfocyten activeren door de presentatie van antigene peptiden via de HLA klasse II-route.

daarom onze in vitro studies suggereren dat CLL-cellen specifiek genen dereguleren in NLC's die betrokken zijn bij immunocompetentie. Hoewel de experimenten werden uitgevoerd op een beperkt aantal patiënten, waren de waargenomen effecten kwantitatief substantieel en daarom van statistische significantie. Bovendien waren de effecten aanwezig bij zowel patiënten met gemuteerde als niet-gemuteerde IGHV toestand. Ontregeling van deze genen, indien gevonden in vivo, zou kunnen leiden tot een vermindering van de immuuncompetentie van NLC's. Rekening houdend met het feit dat ongeveer 60% van de sterfgevallen bij CLL-patiënten wordt veroorzaakt door bacteriële of virale infecties als gevolg van een verworven immuundeficiëntie (Molica, 1994 Rozman & Montserrat, 1995 Bartik et al, 1998), zijn onze bevindingen relevant en voegen ze toe aan eerdere gegevens over factoren die bijdragen aan de verworven immuundeficiëntie van CLL-patiënten: van CLL-cellen zelf is bekend dat ze slechte antigeenpresenterende cellen zijn (Ranheim & Kipps, 1993 Dazzi et al, 1995 ), is het aantal Natural Killer-cellen verminderd in het perifere bloed van CLL-patiënten (Foa et al, 1986) en er is aangetoond dat ze functionele en fenotypische defecten hebben (Foa et al, 1984 ). Bovendien vertonen T-cellen van CLL-patiënten een gestoorde immunologische synapsvorming met antigeenpresenterende cellen (Ramsay et al, 2008), een defecte T-helpercelfunctie hebben (Kunika & Platsoucas, 1988) en een afwijkend T-celreceptorcomplex (Rossi et al, 1996 ). Ten slotte vertonen omstanders CD8+ T-cellen van CLL-patiënten deregulering van genen die betrokken zijn bij de productie en opslag van cytolytische moleculen in lysosomen, evenals intracellulair transport van secretoire blaasjes, die verband houden met antigeenpresentatie en immuunsurveillance tegen virussen en tumorcellen (Gorgun et al, 2005 ). Deze stoornissen lijken erg op de defecten die we hebben waargenomen in CD14CLL-cellen/NLC's. Rekening houdend met het feit dat het absolute aantal NLC's bij CLL-patiënten laag is, zou een verminderde functionaliteit van NLC's een extra bijdrage kunnen zijn aan de verworven immunodeficiëntie bij CLL-patiënten. Hoewel deze verminderde functionaliteit moet worden gevalideerd in vivo, is het zeer waarschijnlijk dat karakterisering van de interactie tussen CLL-cellen en hun micro-omgeving zal helpen om potentiële punten van therapeutische interventie te identificeren. Het is zelfs bewezen dat therapeutische verbindingen die gericht zijn op de micro-omgeving effectief zijn bij CLL, ongeacht subgroepen met genetische risico's ( Ferrajoli et al, 2008 Giannopoulos et al, 2009 ).


Resultaten

SF3B1 knockdown remt celgroei, induceert stilstand van de celcyclus en schaadt erytroïde differentiatie

SF3B1 werd uitgeschakeld met behulp van siRNA-technologie in vier myeloïde cellijnen (TF1, K562, HEL en SKM1) waarvan we vonden dat ze wildtype waren voor SF3B1 (Aanvullende informatie), resulterend in een significante afname van de expressie variërend tussen 50 en 60% (Figuur 1a).

Effecten van SF3B1 knockdown in myeloïde cellijnen. Elke cellijn getransfecteerd met siRNA-targeting SF3B1 werd vergeleken met de overeenkomstige cellijn die was getransfecteerd met de scramble-controle. (een) SF3B1 mRNA-expressie gemeten 3 dagen na knockdown. (B) Groeicurven van cellen met SF3B1 knockdown, vergeleken met cellen die zijn getransfecteerd met de scramble-controle, zoals beoordeeld door uitsluiting van trypanblauw. (C) Celcyclusanalyse van volgende cellijnen: SF3B1 omver gooien. (NS) Erytroïde differentiatie in myeloïde cellijnen met SF3B1 knockdown behandeld met 50 μm hemine, gemeten door HBG1 en KLF1 expressies met betrekking tot de scramble-besturing. (e) Percentage CD36+CD71+ en CD71+CD235a+ populaties in K562-cellen met SF3B1 knockdown vergeleken met de scramble-controle. Resultaten in subpanelen eenNS werden verkregen uit scramble N=2 en SF3B1 siRNA als volgt: een, N=3 B, N=3 C, N=3 voor SKM1 en TF1, N=6 voor HEL en N=9 voor K562 NS, N=3 voor TF1 en HEL, N=6 voor K562. Resultaten in subpaneel e werden verkregen uit scramble N=4 en SF3B1 siRNA N=4. *P<0,05.

Celgroei werd geremd in alle vier de cellijnen met SF3B1 knockdown in vergelijking met de scramble-controle (Figuur 1b). Stilstand van de celcyclus in verschillende fasen werd gedetecteerd in verschillende myeloïde cellijnen met SF3B1 knock-down (Figuur 1c). K562-cellen vertoonden een significante stopzetting van de G2M-celcyclus met een gelijktijdige vermindering van het percentage cellen in de G1- en S-fase. TF1-cellen vertoonden een significante afname van het percentage cellen in de S-fase. HEL-cellen vertoonden een significante afname van het percentage cellen in de G1-fase en een significante toename van de sub-G1-celpopulatie, wat wijst op verhoogde apoptose. Evenzo vertoonden SKM1-cellen een significante afname van het percentage cellen in de S- en G2M-fase met een gelijktijdige toename van het percentage cellen in de sub-G1- en G1-fase, wat wijst op stilstand van de celcyclus in de G1-fase en een toename in apoptose ( Figuur 1c).

Drie cellijnen (TF1, K562 en HEL) met SF3B1 knockdown werden gekweekt met hemine om erytroïde differentiatie te induceren. We hebben de expressie van de erytroïde differentiatiemarkers beoordeeld HBG1 en KLF1 met behulp van qRT-PCR. Een significante vermindering van de expressie van HBG1 en KLF1 werd waargenomen in TF1- en K562-cellijnen met SF3B1 knock-down (Figuur 1d). Daarnaast zagen we een afname in het percentage CD36+CD71+ en CD71+CD235a+ erytroïde populaties (significant voor de CD36+CD71+ populatie) in K562-cellen met SF3B1 knockdown vergeleken met de scramble-controle (Figuur 1e), wat suggereert dat normaal SF3B1 functie is vereist voor erytroïde differentiatie. 17

RARS wordt gekenmerkt door: FTMT accumulatie en lage expressieniveaus van de ijzertransporteur ABCB7. 17, 29 We hebben eerder aangetoond dat: SF3B1 knockdown leidt tot verminderde ABCB7 expressie en verhoogde FTMT expressie in K562-cellen. In deze studie hebben we deze waarnemingen uitgebreid naar de andere drie onderzochte myeloïde cellijnen (Figuur 2a). Daarnaast herstel van SF3B1 expressie tot normale niveaus na 10 dagen kweken werd gevolgd door herstel van ABCB7 expressieniveaus naar normaal (aanvullende figuur S2).

Effecten van SF3B1 knockdown op genexpressie en splicing. (een) ABCB7 en FTMT expressieniveaus in TF1-, K562-, HEL- en SKM1-cellen met SF3B1 knockdown, zoals gemeten door qRT-PCR 48 uur na transfectie. Elke cellijn getransfecteerd met siRNA-targeting SF3B1 werd vergeleken met de overeenkomstige cellijn die was getransfecteerd met de scramble-controle. (B) Omgekeerde transcriptie-PCR van TP53 exons 5-7 tonen afwijkende splicing in K562-cellen met SF3B1 knockdown (siRNA) vergeleken met scramble (SCR). (C, NS). qRT-PCR-analyse met behulp van primers die algemene genexpressie (GE) in een constitutief exon (Ex4 van CCNA2 en Ex3 van STK6) of primers die specifiek zijn voor splice junctions die overeenkomen met exon-opname of overslaan in de cycline A2 (CCNA2) en Aurora Kinase A (STK6) genen in K562-cellen. Cellen met SF3B1 knockdown (siRNA) tonen alternatieve splitsingsgebeurtenissen. Resultaten in subpaneel een werden verkregen uit scramble N=3 en SF3B1 siRNA N=4. Resultaten in subpaneel CNS werden verkregen uit scramble N=2 en SF3B1 siRNA N=3. *P<0,05.

Alles bij elkaar genomen laten deze gegevens zien dat: SF3B1 knockdown resulteert in remming van celgroei, inductie van stopzetting van de celcyclus en verslechtering van erytroïde differentiatie in myeloïde cellijnen.

SF3B1 knockdown verandert genexpressie

Om de effecten van te evalueren SF3B1 knockdown op globale genexpressie, genexpressieprofilering werd uitgevoerd in de vier myeloïde cellijnen. Voor elke cellijn vergeleken we de expressieprofielen van cellen die werden behandeld met twee verschillende siRNA's-targeting SF3B1 met die van cellen behandeld met een scramble-controle, 48 uur na transfectie.

We identificeerden veel genen die in elke cellijn die werd behandeld met >2-voudig werden op- of neerwaarts gereguleerd SF3B1 siRNA's (aanvullende figuur S3A en S3B). Vier genen werden opgereguleerd (TFDP1, LOC100505759, MKRN1 en WRNIP1) en vijf genen werden gedownreguleerd (ZC3H7A, CREBZF, SGK494, WSB1 en twee probesets voor SF3B1) in alle vier de cellijnen met SF3B1 omver gooien.

Pathway-analyse werd uitgevoerd op de opwaartse en neerwaartse gereguleerde genen in elke cellijn met SF3B1 knock-down met IPA. Significante deregulering van routes gerelateerd aan celcyclusregulatie werd waargenomen in alle cellijnen en van mTOR-signalerings- en AMPK-signaleringsroutes in drie cellijnen (tabel 1). We hebben Gene Set Enrichment Analysis uitgevoerd om paden en processen te identificeren die gecoördineerde op- of neerwaartse regulatie vertonen. Opgereguleerde genensets omvatten p53-signalering in K562- en SKM1-cellen, en verschillende genensets geassocieerd met regulatie van transcriptie, spliceosoom en splitsing in K562-cellen (aanvullende tabel S4). Neerwaarts gereguleerde genensets geassocieerd met de mitochondriale functie werden gevonden in K562- en TF1-cellen, en met celcyclusregulatie in SKM1- en HEL-cellen (aanvullende tabel S4). Deze gegevens laten zien dat SF3B1 knockdown in de bestudeerde cellijnen resulteert in deregulering van vele genen en routes, waaronder celcyclus en RNA-verwerking.

SF3B1 knockdown-impact op splitsing

De genoombrede effecten van SF3B1 knockdown op splicing werden onderzocht in twee myeloïde cellijnen (K562 en TF1) met behulp van exon-junction arrays van het menselijk genoom. Het splitsingsprofiel van cellen met SF3B1 knockdown (met behulp van twee verschillende siRNA per cellijn) werd vergeleken met die van cellen die waren getransfecteerd met de scramble-controle.

We observeerden 2027 differentieel tot expressie gebrachte exons van 1419 genen, en 507 significante differentieel gereguleerde splitsingsvarianten (inclusief exon skipping, intronretentie en alternatieve splitsingsplaatsen) van 384 genen in cellen met SF3B1 omver gooien. We observeerden bijvoorbeeld differentieel exongebruik van CDC7 en SRSF11 in de gegevens van zowel de cellijnen als van TP53 in TF1-cellen. We vonden een significante oververtegenwoordiging van 3'-acceptorsplitsingsplaatsen beïnvloed door alternatieve splitsingsgebeurtenissen in vergelijking met 5'-donorsplitsingsplaatsen (5:1 ratio, P=0.0027, χ 2-test met Yates'-correctie), consistent met de bekende rol van SF3B1 bij de herkenning van 3'-splitsingsplaatsen. Genontologie-analyse werd uitgevoerd met behulp van DAVID (//david.abcc.ncifcrf.gov/), en veel thema's vertoonden een significante verrijking van genen die waren aangetast op het niveau van exongebruik en splitsingsvarianten (tabel 2). Celcyclus en RNA-afbraak bleken op beide niveaus consistent te zijn gedereguleerd (Tabel 2). we hebben onderzocht TP53 differentieel exongebruik door PCR-amplificatie en Sanger-sequencing van uit gel geëxtraheerde banden. We observeerden exon-skipping die aanwezig was in de SF3B1 alleen knockdown-cellen (Figuur 2b).

We hebben ook onderzocht of twee celcyclusgenen (CCNA2 en STK6) waarvan eerder is aangetoond dat het aberrant wordt gesplitst in HeLa-cellen met SF3B1 knockdown, 25 werden ook afwijkend gesplitst in K562-cellen met SF3B1 knock-out in onze studie. In overeenstemming met de bevinding in HeLa-cellen, hebben we afwijkende splitsing van deze genen waargenomen met behulp van een qRT-PCR-strategie zoals eerder beschreven (Figuur 2c en d). 25

RNA-Seq in HSPC van MDS-patiënten met SF3B1 mutaties

Inzicht krijgen in het spectrum van genen die gedereguleerd of afwijkend gesplitst zijn in associatie met SF3B1 mutatie in de hematopoietische stam- en progenitorcellen (HSPC) van MDS-patiënten, gebruikten we diepe RNA-Seq om het transcriptoom van beenmerg CD34+-cellen van acht MDS-patiënten te vergelijken met SF3B1 mutatie (SF3B1 mutanten), vier MDS-patiënten zonder bekende splitsingsmutatie (wildtype) en vijf gezonde controles (controle) (aanvullende tabel S3). Met behulp van IGV evalueerden we de expressie van de SF3B1 allelen in SF3B1 mutante gevallen en observeerde een bereik van 45-52% van de mutante allelfrequentie, wat aangeeft dat zowel wildtype als mutante allelen gelijkelijk tot expressie werden gebracht (aanvullende tabel S3, aanvullende figuur S4).

We gebruikten edgeR om differentiële genexpressie-analyse uit te voeren van SF3B1 mutanten versus wildtype en controle. Op het gehele transcriptniveau zagen we in totaal 526 genen (253 opgereguleerd en 273 neerwaarts gereguleerd) significant differentieel tot expressie gebracht in SF3B1 mutanten in vergelijking met wildtype (aanvullende tabel S5). In de vergelijking van SF3B1 mutanten met controle, we vonden 1823 significant differentieel tot expressie gebrachte genen (646 opgereguleerd en 1177 neerwaarts gereguleerd) (aanvullende tabel S6). Genen gekoppeld aan de pathogenese van RARS en RCMD-RS, zoals: ALAS2 en ABCB7, werden gedereguleerd (ALAS2 opgereguleerd en ABCB7 gedownreguleerd) in beide vergelijkingen van SF3B1 mutant met wildtype en controle. We hebben ook opregulatie van de mitochondriale genen waargenomen SLC25A37 bij het vergelijken SF3B1 mutant met controle en GLRX5 in beide vergelijkingen van SF3B1 mutant met wildtype en controle.

We hebben een analyse uitgevoerd met 121 genen waarvan bekend is dat ze tot expressie worden gebracht in erytroïde cellen 30 of die in de literatuur worden beschreven als erytroïde transcriptiefactoren. We vonden 42 differentieel tot expressie gebrachte genen (37 opgereguleerd en 5 neerwaarts gereguleerd) bij het vergelijken SF3B1 mutant met controle. Deze omvatten heem biosynthetische enzymen (bijvoorbeeld ALAS2, ALAD, FECH en UROD), globine-genen (bijvoorbeeld HBQ1, HBA2, HBB en HBA1) en transcriptiefactoren (bijvoorbeeld GATA1, GATA2 en KLF1). In de vergelijking van SF3B1 mutant met wildtype, vonden we in totaal 32 differentieel tot expressie gebrachte genen (31 opgereguleerd en 1 neerwaarts gereguleerd) waarvan 28 overlappend waren met de differentieel tot expressie gebrachte genen die werden gevonden bij het vergelijken SF3B1 mutant met controle.

Vervolgens voerden we routeanalyse uit op de significant differentieel tot expressie gebrachte genen met behulp van IPA. Veel routes, waaronder heembiosynthese, mitotische rollen van polo-achtige kinase en TNFR2-signalering, waren significant gedereguleerd in de vergelijking van SF3B1 mutant met wildtype (tabel 3). Bij het vergelijken SF3B1 mutant met controle, significant gedereguleerde routes omvatten apoptose-signalering, p53-signalering, celcyclusregulatie en heemdegradatie (aanvullende tabel S7). Vervolgens voerden we Gene Set Enrichment Analysis uit en veel genensets die significante verrijking vertoonden, werden geïdentificeerd in SF3B1 mutant versus wildtype en controle. Opgereguleerde genensets omvatten verschillende die gerelateerd waren aan de mitochondriale functie, celcycluscontrolepunten en mRNA-splitsing. In de vergelijking van SF3B1 mutant met controlegevallen, neerwaarts gereguleerde genensets omvatten verschillende die gerelateerd waren aan celdifferentiatie en apoptose (aanvullende tabel S8). Veel van deze gedereguleerde routes en genensets zijn relevant voor de bekende pathofysiologie van MDS en in het bijzonder van RARS en RCMD-RS.

DEXSeq werd gebruikt om differentiële exon-gebruiksanalyse van de RNAseq-gegevens uit te voeren om afwijkend gesplitste genen te evalueren. Op exon-niveau zagen we in totaal 3506 exons (overeenkomend met 1924 genen) die significant differentieel tot expressie werden gebracht in SF3B1 mutant vergeleken met controle (tabel 4, figuur 3, aanvullende tabel S9). Differentieel exongebruik werd waargenomen in ten minste één exon van genen waarvan bekend is dat ze betrokken zijn bij MDS-pathofysiologie (TP53 en EZH1), erytroïde genen (ALAD, UROD en EPB42) en genen geassocieerd met celcyclus (AURKB en CRNDE) en RNA-verwerking (RBM5, RBM25, PRPF40A en HNRNPD). Bij het vergelijken SF3B1 mutant met wildtype-gevallen, vonden we 3097 significant differentieel tot expressie gebrachte exons (overeenkomend met 2022-genen) (tabel 5, figuur 4, aanvullende tabel S10). We vonden differentieel exongebruik in ten minste één exon van genen die betrokken zijn bij MDS-pathofysiologie (CBL, ASXL1 en DNMT3A), mitochondriale functie (ALAS2, NDUFAF6), erytroïde differentiatie (NFE2L2, PPOX en HMBS) en mRNA-verwerking (HNRNPD, U2AF2 en PRPF8). interessant, UQCC1, een gen dat betrokken is bij mitochondriale biogenese 31 en abnormale splicing vertoont SF3B1 mutante gevallen in oogmelanoom, 32 vertoonden differentieel exongebruik en opregulatie in SF3B1 mutante gevallen vergeleken met wildtype en controle in onze studie.

Voorbeelden van genen die significant differentieel exongebruik vertonen tussen MDS-patiënten met SF3B1 mutatie in vergelijking met controle, verkregen uit RNA-Seq-gegevensanalyse met DEXSeq. De grafieken tonen enkele van de best gerangschikte genen met significant differentieel exongebruik. De in paars gemarkeerde exons vertegenwoordigen het significante differentiële exongebruik.

Voorbeelden van genen die significant differentieel exongebruik laten zien bij MDS-patiënten met SF3B1 mutatie in vergelijking met wildtype, verkregen uit RNA-Seq-gegevensanalyse met DEXSeq. De grafieken tonen enkele van de best gerangschikte genen met significant differentieel exongebruik. De in paars gemarkeerde exons vertegenwoordigen het significante differentiële exongebruik.

Om paden te identificeren die worden beïnvloed door differentieel exongebruik, hebben we padanalyse uitgevoerd op de genen die significant differentieel tot expressie gebrachte exons vertoonden met behulp van IPA. In de vergelijking van SF3B1 mutant met wildtype en controle, hebben we waargenomen dat veel routes worden beïnvloed, waaronder celcyclus, heembiosynthese, DNA-schaderespons, mitochondriale en hematopoëtische voorlopercellenroute (aanvullende tabel S11 en S12). Met behulp van de functionele annotatietool van DAVID hebben we een significante verrijking van biologische thema's waargenomen, waaronder alternatieve splicing, RNA-binding, mitochondrion, spliceosoom en celcyclus.

Onlangs is ook een rol voor SF3B1 bij het handhaven van genomische stabiliteit gemeld, waar het functioneert in een door DNA-schade geïnduceerd mRNA-splitsingscomplex met BRCA1 en BCLAF1. Aangezien deregulering van de DNA-schaderesponsroute werd benadrukt door de IPA-routeanalyse, hebben we een analyse uitgevoerd met behulp van genen die worden gereguleerd door het BRCA1-BCLAF1-SF3B1-complex. Verschillende genen die door dit complex worden gereguleerd, vertoonden differentieel exongebruik in SF3B1 mutant compared with control (including NUMA1, RB1, CHUK en ABL1) and compared with wild type (NUMA1, PIAS1, SMAD4, BIRC2 en PTK2) (Supplementary Table S13). The overrepresentation of genes regulated by the BRCA1–BCLAF1–SF3B1 complex was significant in SF3B1 mutant compared with control (P<0.001) and compared with wild type (P=0.0498, hypergeometric test). We also found many genes to be affected at the transcript level, including BIRC3, BCL2A1, GYPB, HBB en HBBP1 when comparing SF3B1 mutant with wild type and control (Supplementary Table S13).


Identification of differentially expressed genes in trabecular bone from the iliac crest of osteoarthritic patients

Osteoarthritis (OA) is clinically characterized by degeneration of the joints and has been traditionally considered a primary disorder of articular cartilage, with secondary changes in the subchondral bone. The increased bone mass and generalized changes in bone quality observed in osteoarthritic patients suggest that OA may be a primary systemic bone disorder with secondary articular cartilage damage. The iliac crest is a skeletal site distant from the affected joint, with a minimal load-bearing function. To provide evidence that OA is a systemic disorder, we searched for differentially expressed genes in the iliac crest bone of patients suffering from hip OA.

Materiaal en methoden

Gene expression levels between bone samples collected at surgery from the iliac crest of patients undergoing total hip arthroplasty for primary OA and younger donors, who were undergoing spinal arthrodesis, were investigated by means of oligonucleotide microarrays. To verify data detected by microarrays technology, Real Time Reverse Transcription-Polymerase Chain Reaction (RT-PCR) assays were performed with specimens from osteoarthritic patients and donors, as well as from elderly donors who were undergoing arthroplasty for subcapital femoral neck fracture.

Resultaten

The microarray analysis surveyed 8327 genes and identified 83 whose expression levels differed at least 1.5-fold in the OA group (P < 0.005). Comparisons between Real Time RT-PCR data from OA and the two donor groups indicated differential expression of genes involved in bone cell functions in the group of OA patients. The genes identified, including CCL2, FOS, PRSS11, DVL2, AKT1, CA2, BMP6, OMD, MMP2, TGFBR3, FLT1, BMP1 en TNFRS11B, have known roles in osteoblast or osteoclast activities.

Conclusies

The data from this study identify a set of genes, closely related to bone cell functions, in which differential regulation in osteoarthritic bone distant from the diseased subchondral bone might underlie the etiopathogenesis of OA as a generalized bone disease.


Inhoud

Expression profiling is a logical next step after sequencing a genome: the sequence tells us what the cell could possibly do, while the expression profile tells us what it is actually doing at a point in time. Genes contain the instructions for making messenger RNA (mRNA), but at any moment each cell makes mRNA from only a fraction of the genes it carries. If a gene is used to produce mRNA, it is considered "on", otherwise "off". Many factors determine whether a gene is on or off, such as the time of day, whether or not the cell is actively dividing, its local environment, and chemical signals from other cells. For instance, skin cells, liver cells and nerve cells turn on (express) somewhat different genes and that is in large part what makes them different. Therefore, an expression profile allows one to deduce a cell's type, state, environment, and so forth.

Expression profiling experiments often involve measuring the relative amount of mRNA expressed in two or more experimental conditions. This is because altered levels of a specific sequence of mRNA suggest a changed need for the protein coded by the mRNA, perhaps indicating a homeostatic response or a pathological condition. For example, higher levels of mRNA coding for alcohol dehydrogenase suggest that the cells or tissues under study are responding to increased levels of ethanol in their environment. Similarly, if breast cancer cells express higher levels of mRNA associated with a particular transmembrane receptor than normal cells do, it might be that this receptor plays a role in breast cancer. A drug that interferes with this receptor may prevent or treat breast cancer. In developing a drug, one may perform gene expression profiling experiments to help assess the drug's toxicity, perhaps by looking for changing levels in the expression of cytochrome P450 genes, which may be a biomarker of drug metabolism. [2] Gene expression profiling may become an important diagnostic test. [3] [4]

The human genome contains on the order of 25,000 genes which work in concert to produce on the order of 1,000,000 distinct proteins. This is due to alternative splicing, and also because cells make important changes to proteins through posttranslational modification after they first construct them, so a given gene serves as the basis for many possible versions of a particular protein. In any case, a single mass spectrometry experiment can identify about 2,000 proteins [5] or 0.2% of the total. While knowledge of the precise proteins a cell makes (proteomics) is more relevant than knowing how much messenger RNA is made from each gene, gene expression profiling provides the most global picture possible in a single experiment. However, proteomics methodology is improving. In other species, such as yeast, it is possible to identify over 4,000 proteins in just over one hour. [6]

Sometimes, a scientist already has an idea of what is going on, a hypothesis, and he or she performs an expression profiling experiment with the idea of potentially disproving this hypothesis. In other words, the scientist is making a specific prediction about levels of expression that could turn out to be false.

More commonly, expression profiling takes place before enough is known about how genes interact with experimental conditions for a testable hypothesis to exist. With no hypothesis, there is nothing to disprove, but expression profiling can help to identify a candidate hypothesis for future experiments. Most early expression profiling experiments, and many current ones, have this form [7] which is known as class discovery. A popular approach to class discovery involves grouping similar genes or samples together using one of the many existing clustering methods such the traditional k-means or hierarchical clustering, or the more recent MCL. [8] Apart from selecting a clustering algorithm, user usually has to choose an appropriate proximity measure (distance or similarity) between data objects. [9] The figure above represents the output of a two dimensional cluster, in which similar samples (rows, above) and similar gene probes (columns) were organized so that they would lie close together. The simplest form of class discovery would be to list all the genes that changed by more than a certain amount between two experimental conditions.

Class prediction is more difficult than class discovery, but it allows one to answer questions of direct clinical significance such as, given this profile, what is the probability that this patient will respond to this drug? This requires many examples of profiles that responded and did not respond, as well as cross-validation techniques to discriminate between them.

In general, expression profiling studies report those genes that showed statistically significant differences under changed experimental conditions. This is typically a small fraction of the genome for several reasons. First, different cells and tissues express a subset of genes as a direct consequence of cellular differentiation so many genes are turned off. Second, many of the genes code for proteins that are required for survival in very specific amounts so many genes do not change. Third, cells use many other mechanisms to regulate proteins in addition to altering the amount of mRNA, so these genes may stay consistently expressed even when protein concentrations are rising and falling. Fourth, financial constraints limit expression profiling experiments to a small number of observations of the same gene under identical conditions, reducing the statistical power of the experiment, making it impossible for the experiment to identify important but subtle changes. Finally, it takes a great amount of effort to discuss the biological significance of each regulated gene, so scientists often limit their discussion to a subset. Newer microarray analysis techniques automate certain aspects of attaching biological significance to expression profiling results, but this remains a very difficult problem.

The relatively short length of gene lists published from expression profiling experiments limits the extent to which experiments performed in different laboratories appear to agree. Placing expression profiling results in a publicly accessible microarray database makes it possible for researchers to assess expression patterns beyond the scope of published results, perhaps identifying similarity with their own work.

Both DNA microarrays and quantitative PCR exploit the preferential binding or "base pairing" of complementary nucleic acid sequences, and both are used in gene expression profiling, often in a serial fashion. While high throughput DNA microarrays lack the quantitative accuracy of qPCR, it takes about the same time to measure the gene expression of a few dozen genes via qPCR as it would to measure an entire genome using DNA microarrays. So it often makes sense to perform semi-quantitative DNA microarray analysis experiments to identify candidate genes, then perform qPCR on some of the most interesting candidate genes to validate the microarray results. Other experiments, such as a Western blot of some of the protein products of differentially expressed genes, make conclusions based on the expression profile more persuasive, since the mRNA levels do not necessarily correlate to the amount of expressed protein.

Data analysis of microarrays has become an area of intense research. [10] Simply stating that a group of genes were regulated by at least twofold, once a common practice, lacks a solid statistical footing. With five or fewer replicates in each group, typical for microarrays, a single outlier observation can create an apparent difference greater than two-fold. In addition, arbitrarily setting the bar at two-fold is not biologically sound, as it eliminates from consideration many genes with obvious biological significance.

Rather than identify differentially expressed genes using a fold change cutoff, one can use a variety of statistical tests or omnibus tests such as ANOVA, all of which consider both fold change and variability to create a p-value, an estimate of how often we would observe the data by chance alone. Applying p-values to microarrays is complicated by the large number of multiple comparisons (genes) involved. For example, a p-value of 0.05 is typically thought to indicate significance, since it estimates a 5% probability of observing the data by chance. But with 10,000 genes on a microarray, 500 genes would be identified as significant at p < 0.05 even if there were no difference between the experimental groups. One obvious solution is to consider significant only those genes meeting a much more stringent p value criterion, e.g., one could perform a Bonferroni correction on the p-values, or use a false discovery rate calculation to adjust p-values in proportion to the number of parallel tests involved. Unfortunately, these approaches may reduce the number of significant genes to zero, even when genes are in fact differentially expressed. Current statistics such as Rank products aim to strike a balance between false discovery of genes due to chance variation and non-discovery of differentially expressed genes. Commonly cited methods include the Significance Analysis of Microarrays (SAM) [11] and a wide variety of methods are available from Bioconductor and a variety of analysis packages from bioinformatics companies.

Selecting a different test usually identifies a different list of significant genes [12] since each test operates under a specific set of assumptions, and places a different emphasis on certain features in the data. Many tests begin with the assumption of a normal distribution in the data, because that seems like a sensible starting point and often produces results that appear more significant. Some tests consider the joint distribution of all gene observations to estimate general variability in measurements, [13] while others look at each gene in isolation. Many modern microarray analysis techniques involve bootstrapping (statistics), machine learning or Monte Carlo methods. [14]

As the number of replicate measurements in a microarray experiment increases, various statistical approaches yield increasingly similar results, but lack of concordance between different statistical methods makes array results appear less trustworthy. The MAQC Project [15] makes recommendations to guide researchers in selecting more standard methods (e.g. using p-value and fold-change together for selecting the differentially expressed genes) so that experiments performed in different laboratories will agree better.

Different from the analysis on differentially expressed individual genes, another type of analysis focuses on differential expression or perturbation of pre-defined gene sets and is called gene set analysis. [16] [17] Gene set analysis demonstrated several major advantages over individual gene differential expression analysis. [16] [17] Gene sets are groups of genes that are functionally related according to current knowledge. Therefore, gene set analysis is considered a knowledge based analysis approach. [16] Commonly used gene sets include those derived from KEGG pathways, Gene Ontology terms, gene groups that share some other functional annotations, such as common transcriptional regulators etc. Representative gene set analysis methods include Gene Set Enrichment Analysis (GSEA), [16] which estimates significance of gene sets based on permutation of sample labels, and Generally Applicable Gene-set Enrichment (GAGE), [17] which tests the significance of gene sets based on permutation of gene labels or a parametric distribution.

While the statistics may identify which gene products change under experimental conditions, making biological sense of expression profiling rests on knowing which protein each gene product makes and what function this protein performs. Gene annotation provides functional and other information, for example the location of each gene within a particular chromosome. Some functional annotations are more reliable than others some are absent. Gene annotation databases change regularly, and various databases refer to the same protein by different names, reflecting a changing understanding of protein function. Use of standardized gene nomenclature helps address the naming aspect of the problem, but exact matching of transcripts to genes [18] [19] remains an important consideration.

Having identified some set of regulated genes, the next step in expression profiling involves looking for patterns within the regulated set. Do the proteins made from these genes perform similar functions? Are they chemically similar? Do they reside in similar parts of the cell? Gene ontology analysis provides a standard way to define these relationships. Gene ontologies start with very broad categories, e.g., "metabolic process" and break them down into smaller categories, e.g., "carbohydrate metabolic process" and finally into quite restrictive categories like "inositol and derivative phosphorylation".

Genes have other attributes beside biological function, chemical properties and cellular location. One can compose sets of genes based on proximity to other genes, association with a disease, and relationships with drugs or toxins. The Molecular Signatures Database [20] and the Comparative Toxicogenomics Database [21] are examples of resources to categorize genes in numerous ways.

Regulated genes are categorized in terms of what they are and what they do, important relationships between genes may emerge. [23] For example, we might see evidence that a certain gene creates a protein to make an enzyme that activates a protein to turn on a second gene on our list. This second gene may be a transcription factor that regulates yet another gene from our list. Observing these links we may begin to suspect that they represent much more than chance associations in the results, and that they are all on our list because of an underlying biological process. On the other hand, it could be that if one selected genes at random, one might find many that seem to have something in common. In this sense, we need rigorous statistical procedures to test whether the emerging biological themes is significant or not. That is where gene set analysis [16] [17] comes in.

Cause and effect relationships Edit

Fairly straightforward statistics provide estimates of whether associations between genes on lists are greater than what one would expect by chance. These statistics are interesting, even if they represent a substantial oversimplification of what is really going on. Hier is een voorbeeld. Suppose there are 10,000 genes in an experiment, only 50 (0.5%) of which play a known role in making cholesterol. The experiment identifies 200 regulated genes. Of those, 40 (20%) turn out to be on a list of cholesterol genes as well. Based on the overall prevalence of the cholesterol genes (0.5%) one expects an average of 1 cholesterol gene for every 200 regulated genes, that is, 0.005 times 200. This expectation is an average, so one expects to see more than one some of the time. The question becomes how often we would see 40 instead of 1 due to pure chance.

According to the hypergeometric distribution, one would expect to try about 10^57 times (10 followed by 56 zeroes) before picking 39 or more of the cholesterol genes from a pool of 10,000 by drawing 200 genes at random. Whether one pays much attention to how infinitesimally small the probability of observing this by chance is, one would conclude that the regulated gene list is enriched [24] in genes with a known cholesterol association.

One might further hypothesize that the experimental treatment regulates cholesterol, because the treatment seems to selectively regulate genes associated with cholesterol. While this may be true, there are a number of reasons why making this a firm conclusion based on enrichment alone represents an unwarranted leap of faith. One previously mentioned issue has to do with the observation that gene regulation may have no direct impact on protein regulation: even if the proteins coded for by these genes do nothing other than make cholesterol, showing that their mRNA is altered does not directly tell us what is happening at the protein level. It is quite possible that the amount of these cholesterol-related proteins remains constant under the experimental conditions. Second, even if protein levels do change, perhaps there is always enough of them around to make cholesterol as fast as it can be possibly made, that is, another protein, not on our list, is the rate determining step in the process of making cholesterol. Finally, proteins typically play many roles, so these genes may be regulated not because of their shared association with making cholesterol but because of a shared role in a completely independent process.

Bearing the foregoing caveats in mind, while gene profiles do not in themselves prove causal relationships between treatments and biological effects, they do offer unique biological insights that would often be very difficult to arrive at in other ways.

Using patterns to find regulated genes Edit

As described above, one can identify significantly regulated genes first and then find patterns by comparing the list of significant genes to sets of genes known to share certain associations. One can also work the problem in reverse order. Here is a very simple example. Suppose there are 40 genes associated with a known process, for example, a predisposition to diabetes. Looking at two groups of expression profiles, one for mice fed a high carbohydrate diet and one for mice fed a low carbohydrate diet, one observes that all 40 diabetes genes are expressed at a higher level in the high carbohydrate group than the low carbohydrate group. Regardless of whether any of these genes would have made it to a list of significantly altered genes, observing all 40 up, and none down appears unlikely to be the result of pure chance: flipping 40 heads in a row is predicted to occur about one time in a trillion attempts using a fair coin.

For a type of cell, the group of genes whose combined expression pattern is uniquely characteristic to a given condition constitutes the gene signature of this condition. Ideally, the gene signature can be used to select a group of patients at a specific state of a disease with accuracy that facilitates selection of treatments. [25] [26] Gene Set Enrichment Analysis (GSEA) [16] and similar methods [17] take advantage of this kind of logic but uses more sophisticated statistics, because component genes in real processes display more complex behavior than simply moving up or down as a group, and the amount the genes move up and down is meaningful, not just the direction. In any case, these statistics measure how different the behavior of some small set of genes is compared to genes not in that small set.

GSEA uses a Kolmogorov Smirnov style statistic to see whether any previously defined gene sets exhibited unusual behavior in the current expression profile. This leads to a multiple hypothesis testing challenge, but reasonable methods exist to address it. [27]

Expression profiling provides new information about what genes do under various conditions. Overall, microarray technology produces reliable expression profiles. [28] From this information one can generate new hypotheses about biology or test existing ones. However, the size and complexity of these experiments often results in a wide variety of possible interpretations. In many cases, analyzing expression profiling results takes far more effort than performing the initial experiments.

Most researchers use multiple statistical methods and exploratory data analysis before publishing their expression profiling results, coordinating their efforts with a bioinformatician or other expert in DNA microarrays. Good experimental design, adequate biological replication and follow up experiments play key roles in successful expression profiling experiments.


Identification of Differentially Expressed Genes and Elucidation of Pathophysiological Relevance of ABCA1 in HaCaT Cells Induced by PM2.5

Doelstelling. In order to investigate the effects of PM2.5 on proliferation, cell cycle, apoptosis, and potential mechanism of human keratinocyte cell line HaCaT. Methoden:. HaCaT cells were treated with different concentrations of PM2.5 suspension for 24 hours. Cell viability was detected by the CCK-8 method. Cell cycle distribution and apoptosis were detected by flow cytometry. Microarray analyses were used to find out the microarray gene expression profiling data processing included gene enrichment and pathway analysis. Western blot was conducted to validate the key pathways and regulators in the microarray analysis. Resultaten. The cell activity decreased, and the cell cycle was significantly inhibited with the increase in PM2.5 concentration. Also, by conducting the gene expression microarray assay, we identified 541 upregulated genes and 935 downregulated genes in PM2.5-treated HaCaT cells. Real-time qPCR and western blot confirmed that PM2.5 treatment could induce the expression of ABCA1 while inhibiting that of END1 and CLDN1. Conclusie. Our results showed that PM2.5 could potentially regulate cell apoptosis and cell cycle arrest via ABCA1-, END1-, ID1-, and CLDN1-mediated pathways in human HaCaT cells, which laid a good foundation for follow-up drug intervention and drug development against skin damage caused by PM2.5 exposure.

1. Inleiding

The World Health Organization (WHO) reported that air pollution was one of the world’s largest environmental health risk factors. Air pollution is a heterogeneous mixture of chemicals and solid particles. Ambient particulate matters (PMs) are one major component of air pollutants. PMs, especially particles on the nanosized range, are the main cause of risk factors [1]. Ambient particulate matter 2.5 (PM2.5) was one of the main components of air pollutants, which can absorb many polycyclic aromatic hydrocarbons and metals [2].

Air pollution-related mortality and morbidity from respiratory and cardiovascular diseases could be traced back to the 1950s. Long-term exposure to PM2.5 is a potential risk factor for various diseases including cancer and cardiovascular and respiratory diseases [3–7]. The skin provides a major defense against air pollutants [8, 9], which can cause human skin damage and exacerbate preexistent skin diseases, such as erythema, hyperplasia, skin aging, atopic dermatitis, and carcinogenesis [10–12]. However, the effects of PM2.5 on the function of human skin and its biological significance in skin homeostasis remain inconclusively understood. Previously, we have demonstrated exposure to PM2.5 is associated with skin damages like senile lentigo [13]. In this study, we focused on the HaCaT cell proliferation and apoptosis under PM2.5 challenge and employed gene microarray analysis to identify upstream regulators and found out that genes associated with an inflammatory response were engaged in PM2.5-stimulated HaCaT apoptosis.

2. Methods and Materials

2.1. Main Reagents and Equipment

HaCaT cells (Dermatology, Peking University People’s Hospital, The second clinical academy of Peking University medicine school), PMI1640 medium (Sigma, USA), trypsin (Gibco, USA), fetal bovine serum (Shanghai Enzyme-linked Biotechnology Co., Ltd.), Rabbit anti-human IL-1 and IL-6 monoclonal antibodies, horseradish peroxidase-labeled goat anti-rabbit IgG (CST, USA), TRIzol reagent, and RT-PCR kit were used (Invitrogen, USA). High-speed refrigerated centrifugation (Beckman, USA), constant temperature CO2 incubator, and ABI7900 real-time PCR instrument (ABI, USA) were used.

2.2. Methoden:
2.2.1. Preparation of PM2.5 Turbid Liquid and Particle Treatment

At the junction of the East Second Ring Road and the East Third Ring Road in Beijing, we collected air samples which were 20 m above the top of buildings during the heating period of winter (from December to January). HY-1000 intelligent large-flow TSP sampler (optional PM2.5 cutter, Qingdao Hengyuan Technology Development Co., Ltd.) was used for quartz filter sampling. The average flow rate was set at 1000 L/min, and each sample was continuously collected for 24 hours. The quartz membrane was equilibrated under constant temperature and humidity conditions for 24 hours. Then, the filter was cut into approximately 1 cm 2 with sterilized surgical scissors and immersed in 75% ethanol, followed by ultrasonic shaking for 60 minutes in a water bath to elute the particles, after which ice was added in to keep the water temperature below 20°C. In the biological safety cabinet, the eluate was filtered into a plurality of glass dishes with 70 μm filters, and the UV lamp was utilized for total sterilization. After most of the ethanol was volatilized, the eluate was vacuum dried for 24 hours, after which samples were weighed. Sterile water was used to prepare a high concentration stock solution which was stored at −20°C. All of the above procedures were processed in the Toxicology Room of the Environmental and Health-Related Product Safety Institute of the Chinese Center for Disease Control and Prevention.

2.2.2. Cell Culture and Cell Counting Kit-8 (CCK-8)

HaCaT cells were cultured in 5% CO2 at 37°C in regular Dulbecco’s Modified Eagle’s Medium (DMEM) (Invitrogen Co. Ltd) containing 1.8 mM Ca 2+ or with DMEM (Gibco, Life Technologies, Carlsbad, CA, USA) at a low concentration of Ca 2+ (0.07 mM). Both media were supplemented with 10% heat-inactivated fetal bovine serum, glutamine (2 mM), penicillin (100 U/ml) (Euroclone), and streptomycin (100 mg/ml) (Euroclone). Cells were stimulated with different concentrations of PM2.5 (50 μg/ml, 100 μg/ml, 200 μg/ml, and 400 μg/ml) in HaCaT cells at 24 h and 48 h. Cells were seeded in 96-well plates at a density of 2.0 × 10 3 cells per well. Each sample was repeated five times. Then, cell proliferation was determined using CCK-8 (Sigma-Aldrich, St. Louis, MO, USA) for five days after seeding. In brief, CCK-8 solution was added to each well and incubated at 37°C for 4 h according to the manufacturer’s protocol. Following this, the optical density (OD) value at 450 nm was determined using a microplate reader (Tecan Infinite, Männedorf, Switzerland).

2.2.3. Microarray Analysis

HaCaT cells were treated by 200 ug/ml PM2.5, and untreated HaCaT cells were collected for microarray analysis, microarray gene expression profiling, and data processing.

(1) RNA Preparation and Quality Control. Total RNA from cultured HaCaT cells was extracted by TRIzol and purified using RNeasy RNA extraction kit. Quality control of extracted RNA was subsequently validated by both Thermo Nanodrop 3000 and Agilent 2100 bioanalyzer with utilization of Agilent RNA 6000 Nano Kit. Total RNA will be subjected to microarray analysis until it meets the following standards: 1.8 <A260/A280 <2.0 by Thermo Nanodrop 3000 and RIN> = 7.0 and 28S/18S >0.75 by Agilent 2100 bioanalyzer.

(2) Microarray Processing and Data Analysis. 6 GeneChip microarrays (Affymetrix 901838) were hybridized with three pairs of samples to determine gene expression profiles of the control and treatment samples according to the manufacturer’s instructions. Finally, raw data were imported to R (http://www.r-project.org) and analyzed by the Bioconductor affy package (http://www.bioconductor.org). Logarithmic (base 2) intensity measures were obtained by RMA. The intensity was converted to nonlogarithmic values and rescaled by adjusting mean intensity on each array to 400. Cell files and RMA values were deposited on Gene Expression Omnibus (http://www.ncibi.nih.gov/geo/).

(3) Identification of Differential Expressed Genes (DEGs). Limma package was used to normalize the microarray raw data, and genes with (log2fold change) > = 2 and

indicated that there is a statistically significant difference between the groups.

(4) Enrichment Analysis of DEGs. The online functional annotation tool, DAVID (http://www.abcc.ncifcrf.gov), was then used to perform the GO-BP functional enrichment analysis for DEGs, with the threshold of

. Pathway enrichment analysis was done using both KEGG (http://www.kegg.jp/Kegg/pathway.html) and Reactome (http://www.reactome.org) databases. was selected as the threshold value.

(5) Pathway and Network Analysis. The list of significantly overexpressed or downregulated genes identified by Affymetrix probe set IDs, fold changes, and P values were uploaded into the Ingenuity Pathway Analysis (IPA) tool (http://www.ingenuity.com). Each clone identifier was mapped to its corresponding gene object in the Ingenuity Pathway Knowledge Base (IPKB). These focus genes were then used for constructing biological networks, using the “IPA” core analysis function. To start building networks, the application queries the IPKB for interactions between focus genes and all other gene objects stored in the knowledge base and generates a set of networks. Every resulting gene interaction has supporting literature findings available online. IPA then computes a score for each network according to the fit of the user’s set of significant genes. The score is derived from value and indicates the likelihood of the focus genes in a network being found together as a result of random chance. A score of 2 indicates that there is a 1-in-100 chance that the focus genes are together in a network as a result of random chance. Therefore, scores of 2 or higher have at least 99.5% confidence of not being generated by random chance alone.

2.2.4. Western Blot

Total protein was extracted from cells and quantified. Transmembrane was performed after electrophoresis. After blocking with 5% skim milk for 1.5 h, membranes were incubated with primary rabbit anti-human monoclonal antibodies of IL-1, IL-6, and GAPDH (1 : 1000 Cat nos: #12703, #12153, #8884 Cell Signaling Technology, Danvers, MA, USA) overnight at 4°C. After washing with TBST three times, 5 min each time, membranes were incubated with Horseradish peroxidase-labeled goat anti-rabbit IgG secondary polyclonal antibody (1 : 2000 Cat nos: A0208, Beyotime Biotechnology, Shanghai, China) at 37°C for 2 h. After washing with TBST three times, 10–15 min each time, color development was performed, and the signal was detected. GAPDH was used as endogenous control.

2.2.5. Realtime PCR

PCR reactions were performed using real-time PCR kit with a reaction system of 10 μik. PCR reaction conditions were as follows: 95°C for 10 min, followed by 35 cycles of 95°C for 30 s, 59°C for 30 s, and 72°C for 25 s. In this study, Roche 384 real-time PCR amplification instrument was used to carry out real-time fluorescence quantitative PCR reactions with GAPDH as endogenous control. Data were processed using the ΔΔCt method, and three replicates were set for each sample.

2.2.6. Flow Cytometry

Cell cycle and apoptosis were determined using flow cytometry. In brief, cells were seeded in 6 cm dish overnight to a confluency of 80%. Then, cells were trypsinized, washed with precooled D-Hanks (pH = 7.2–7.4) buffer, and fixed with 75% ethanol at 4°C for 1 h. Following this, cells were stained with propidium iodide (PI) solution (PI 50 μg/mL and RNase A 200 μg/mL, Sigma-Aldrich, St. Louis, MO, USA) at RT for 30 min in the dark and then analyzed using a Guava®easyCyte flow cytometer (Millipore, Billerica, MA, USA). Each experiment was performed in triplicate, and the average value was calculated as the final result.

3. Resultaten

3.1. Effect of PM2.5 on Cell Viability, Cell Cycle, and Cytokine Secretion

Stimulated with different concentrations of PM2.5 (50 ug/ml, 100 ug/ml, 200 ug/ml, and 400 ug/ml) in HaCaT cells at 24 h and 48 h, the cell activity decreased with the increase in PM2.5 concentration (Figure 1(a)). Stimulated with different concentrations of PM2.5 (50 ug/ml, 100 ug/ml, 200 ug/ml, and 400 ug/ml) in HaCaT cells at 24 h and 48 h, the cell cycle was significantly inhibited with the increase in PM2.5 concentration (Figures 1(b) and 1(c)). Cell apoptosis HaCaT cells after 24 h and 48 h PM2.5 treatment were observed under microscope (Figures 1(d) and 1(e)).


Bekijk de video: Dr Zaharuddin Abd Rahman Goyang Kaki Dapat Duit. Pelaburan. Mudharabah (December 2021).