We are searching data for your request:
Upon completion, a link will appear to access the found materials.
Vėžio genomo atlasas (TCGA) turi atvirus duomenis apie mažiausiai 10 000 skirtingų vėžiu sergančių pacientų kopijų skaičiaus variacijos (CNV). Jie siūlo dviejų tipų duomenis: CNV duomenis iš naviko ir CNV duomenis iš normalių audinių mėginių. Ar yra kokių nors kitų atvirų duomenų bazių, kurios siūlo bent vieno vėžio tipo CNV duomenis?
ICGC turi CNV duomenis apie daugelį skirtingų vėžio tipų. Jame yra daug ribotų ir atvirų duomenų rinkinių. DCC leidimų puslapis leis jums juos permesti – tuos, kurie yra vieši, galite lengvai atsisiųsti. Jie taip pat turi suderintus daugelio mėginių ekspresijos, SNV, DNR metilinimo ir struktūrinių mutacijų duomenis.
CODEX2: viso spektro kopijų skaičiaus kitimo aptikimas didelio našumo DNR sekos nustatymu
Didelio našumo DNR sekos nustatymas leidžia aptikti kopijų skaičiaus variacijas (CNV) viso genomo skalėje ir geresne skiriamąja geba, palyginti su masyvo metodais, tačiau kenčia nuo paklaidų ir artefaktų, dėl kurių atsiranda klaidingų atradimų ir mažas jautrumas. Mes apibūdiname CODEX2, kaip statistinę viso spektro CNV profiliavimo sistemą, kuri yra jautri variantams, kurių populiacijos dažnis yra įprastas, ir kuris yra taikomas tyrimų projektams su neigiamais kontroliniais mėginiais ir be jų. Mes demonstruojame ir vertiname CODEX2 pagal viso egzomo ir tikslinės sekos duomenis, kur šališkumas yra ryškiausias. CODEX2 pranoksta esamus metodus ir ypač žymiai pagerina įprastų CNV jautrumą.
Atidarykite duomenų bazes kopijų skaičiaus variacijoms, panašioms į TCGA – Biology
Genominės sekos variacija
http://www.1000genomes.org/
Duomenų rinkimas ir žmonių variacijų katalogas
dbVar ir genominių variantų duomenų bazė
Internetinis Mendelio paveldėjimas žmoguje
http://www.omim.org/about
OMIM yra išsamus, autoritetingas žmogaus genų ir genetinių fenotipų rinkinys, kuris yra laisvai prieinamas ir atnaujinamas kasdien. Viso teksto, nurodytose OMIM apžvalgose yra informacijos apie visus žinomus mendelio sutrikimus ir daugiau nei 12 000 genų. OMIM daugiausia dėmesio skiria fenotipo ir genotipo ryšiui. Jis atnaujinamas kasdien, o įrašuose yra daug nuorodų į kitus genetikos išteklius.
„Exome Aggregation Consortium“ (ExAC)
http://exac.broadinstitute.org/
ExAC yra tyrėjų koalicija, siekianti apibendrinti ir suderinti egzomų sekos nustatymo duomenis iš įvairių didelio masto sekos nustatymo projektų ir pateikti apibendrintus duomenis platesnei mokslo bendruomenei. Šioje svetainėje pateiktas duomenų rinkinys apima 61 486 nesusijusius asmenis, sekvenuotus kaip įvairių specifinių ligų ir populiacijos genetinių tyrimų dalis. Pašalinome asmenis, sergančius sunkia vaikų liga, todėl šis duomenų rinkinys turėtų būti naudingas etaloninis alelių dažnių rinkinys sunkių ligų tyrimams. Visi neapdoroti šių projektų duomenys buvo pakartotinai apdoroti naudojant tą patį dujotiekį ir kartu iškviesti variantai, siekiant padidinti projektų nuoseklumą.
DNR elementų enciklopedijos (ENCODE) projektas
http://encodeproject.org/
Nuorodos į ENCODE2 vienodai apdorotus histono ženklų duomenis: https://sites.google.com/site/anshulkundaje/projects/encodehistonemods
Nuorodos į kitus vienodai tvarkomus ENCODE2 duomenis: http://genome.ucsc.edu/ENCODE/downloads.html
Duomenų rinkimas, integracinė analizė ir išsamus katalogas
visi seka pagrįsti funkciniai elementai
Epigenomikos projektas (NIH bendras fondas)
Tarptautinis žmogaus epigenomų konsorciumas (IHEC)
http://www.ihec-epigenomes.org/
Duomenų rinkimas ir rakto žmogaus epigenomų pamatiniai žemėlapiai
ląstelių būsenos, svarbios sveikatai ir ligoms
###Žmogaus kūno žemėlapis, kurį galima peržiūrėti naudojant „Ensemble“ (http://www.ensembl.org/index.html) arba
Integruota genomikos peržiūra (http://www.broadinstitute.org/igv/)
Genų ekspresijos duomenų bazė iš Illumina, iš RNR-seq duomenų
###Cancer CellLine Encyclopedia (CCLE) http://www.broadinstitute.org/ccle/home
Masyvo išraiškos duomenys, CNV, mutacijos, perturbacijos per didžiulę ląstelių linijų kolekciją
###FANTOM5 projektas http://fantom.gsc.riken.jp/
http://fantom.gsc.riken.jp/5/sstar/Data_source
Didelė CAGE pagrįstų išraiškos duomenų apie kelias rūšis kolekcija (laiko eilutės ir trikdžiai)
http://www.ebi.ac.uk/gxa/
Duomenų bazė, palaikanti sąlygai būdingų genų ekspresijos užklausas
kuruojamas „Array Express“ archyvo pogrupis.
GNF genų ekspresijos atlasas
Galima peržiūrėti BioGPS (http://biogps.org/#goto=welcome)
GNF (Novartis Research Foundation Genomics Institute) žmogaus ir pelių genų ekspresijos masyvo duomenys.
http://www.proteinatlas.org/
Baltymų ekspresijos profiliai, pagrįsti daugelio žmogaus audinių, vėžio ir ląstelių linijų imunohistochemija, tarpląstelinė lokalizacija, transkripto ekspresijos lygiai
http://www.uniprot.org/
Išsami, laisvai prieinama baltymų sekos duomenų bazė ir
funkcinė informacija
http://www.ebi.ac.uk/interpro/
Integruota baltymų klasifikavimo, funkcinių domenų duomenų bazė,
ir anotacija (įskaitant GO terminus).
Baltymų surinkimo reagentų iniciatyva
http://commonfund.nih.gov/proteincapture/
Išteklių generavimas: atsinaujinantys monokloniniai antikūnai ir kiti reagentai, nukreipti į visą baltymų spektrą
Knockout Mouse programa (KOMP)
Ryšio žemėlapis (CMAP)
http://www.broadinstitute.org/cmap/
Jungiamumo žemėlapis (taip pat žinomas kaip cmap) yra genomo transkripcijos ekspresijos duomenų rinkinys iš kultivuotų žmogaus ląstelių, apdorotų bioaktyviomis mažomis molekulėmis ir paprastais modelių derinimo algoritmais, kurie kartu leidžia atrasti funkcinius ryšius tarp vaistų, genų ir ligų. trumpalaikis bendrų genų ekspresijos pokyčių požymis. Daugiau apie cmap galite sužinoti iš mūsų straipsnių „Science and Nature Reviews Cancer“.
Integruoto tinklo korinio parašo (LINCS) biblioteka
https://commonfund.nih.gov/LINCS/
Duomenų rinkimas ir molekulinių parašų, apibūdinančių kaip tai, analizė
skirtingų tipų ląstelės reaguoja į įvairius trikdžius sukeliančius veiksnius
Vėžio jautrumo vaistams genomas
http://www.cancerrxgene.org/
Mutacija, CNV, Affy ekspresija ir jautrumas vaistams
Narkotikų genų sąveikos duomenų bazė (DGIdb)
Molekulinių bibliotekų programa (MLP)
https://commonfund.nih.gov/molecularlibraries/index.aspx
Prieiga prie didelio masto atrankos pajėgumų, reikalingų mažoms molekulėms, kurias galima optimizuoti kaip cheminius zondus, kad būtų galima tirti genų, ląstelių ir biocheminių takų funkcijas sveikatos ir ligų srityje.
http://www.brain-map.org/
Duomenų rinkimas ir internetiniai viešieji ištekliai, integruojantys plačią genų ekspresiją ir neuroanatominius duomenis apie žmogų ir pelę, įskaitant pelės genų ekspresijos pokyčius pagal padermę.
http://braincloud.jhmi.edu/
„BrainCloud“ yra laisvai prieinama, biologams patogi, atskira programa, skirta tyrinėti transkripcijos laiko dinamiką ir genetinę kontrolę žmogaus prefrontalinėje žievėje per visą gyvenimą. „BrainCloud“ buvo sukurta bendradarbiaujant Lieber institutui ir NIMH
Žmogaus ryšio projektas
http://www.humanconnectomeproject.org/
Duomenų rinkimas ir integravimas, siekiant sukurti išsamų struktūrinių ir funkcinių nervinių jungčių žemėlapį individų viduje ir tarp jų
Geuvadis RNR sekos nustatymo projektas iš 1000 genomų mėginių
http://www.geuvadis.org/web/geuvadis
mRNR ir mažos RNR sekos nustatymas 465 limfoblastoidinių ląstelių linijos (LCL) mėginiuose iš 5 1000 genomų projekto populiacijų: CEPH (CEU), suomių (FIN), britų (GBR), Toscani (TSI) ir jorubos (YRI).
http://www.broadinstitute.org/achilles Projektas Achilas yra sistemingos pastangos, kuriomis siekiama nustatyti ir kataloguoti genetinius pažeidžiamumus šimtuose genomiškai apibūdintų vėžio ląstelių linijų. Projektas naudoja genomo masto shRNR biblioteką, kad nutildytų atskirus genus ir nustatytų tuos genus, kurie turi įtakos ląstelių išlikimui. Didelio masto funkcinis vėžio ląstelių linijų patikrinimas suteikia papildomą požiūrį į tuos tyrimus, kuriais siekiama apibūdinti pirminių navikų molekulinius pokyčius (mutacijas, kopijų skaičiaus pokyčius ir kt.), pvz., Vėžio genomo atlasą. Bendras projekto tikslas yra susieti vėžio genetinę priklausomybę su jų molekulinėmis savybėmis, siekiant nustatyti molekulinius taikinius ir nukreipti terapinį vystymąsi.
Žmogaus senėjimo genominiai ištekliai
Vėžio genomo atlasas (TCGA)
http://cancergenome.nih.gov/
Duomenų rinkimas ir duomenų saugykla, įskaitant vėžio genomo sekos duomenis
Tarptautinis vėžio genomo konsorciumas (ICGC)
http://www.icgc.org/
Duomenų rinkimas ir duomenų saugykla, skirta išsamiam vėžio genominių, transkriptominių ir epigenominių pokyčių aprašymui
Genotipo-audinio ekspresijos (GTEx) projektas
https://commonfund.nih.gov/GTEx/
Duomenų rinkimas, duomenų saugykla ir mėginių bankas, skirtas žmogaus genų ekspresijai ir reguliavimui keliuose audiniuose, palyginti su genetine variacija
Knockout Mouse fenotipų nustatymo programa (KOMP2)
https://commonfund.nih.gov/KOMP2/
Duomenų rinkimas, skirtas standartizuotam viso genomo pelių išmušimo kolekcijos fenotipui nustatyti
Genotipų ir fenotipų duomenų bazė (dbGaP)
http://www.ncbi.nlm.nih.gov/gap
Genotipo ir fenotipo sąveiką tiriančių tyrimų rezultatų duomenų saugykla
NHGRI paskelbto GWAS katalogas
http://www.genome.gov/gwastudies/
Viešas paskelbtų genomo asociacijos tyrimų katalogas
Klinikinė genomo duomenų bazė
http://research.nhgri.nih.gov/CGD/
Rankiniu būdu kuruojama būklių su žinomomis genetinėmis priežastimis duomenų bazė, kurioje daugiausia dėmesio skiriama mediciniškai reikšmingiems genetiniams duomenims ir galimoms intervencijoms.
NHGRI informacijos apie krūties vėžį branduolys
http://www.ncbi.nlm.nih.gov/clinvar/
„ClinVar“ sukurtas taip, kad būtų laisvai prieinamas viešas ataskaitų apie žmonių variacijų ir fenotipų ryšius archyvas su patvirtinamaisiais įrodymais. „ClinVar“ renka ataskaitas apie pacientų mėginiuose rastus variantus, teiginius apie jų klinikinę reikšmę, informaciją apie pateikėją ir kitus patvirtinamuosius duomenis. Pateikimuose aprašyti aleliai yra susieti su etaloninėmis sekomis ir pateikiami pagal HGVS standartą. Tada ClinVar pateikia duomenis interaktyviems vartotojams, taip pat tiems, kurie nori naudoti ClinVar kasdienėse darbo eigose ir kitose vietinėse programose. ClinVar dirba bendradarbiaudama su suinteresuotomis organizacijomis, siekdama kuo efektyviau ir efektyviau patenkinti medicinos genetikos bendruomenės poreikius.
Žmogaus genų mutacijų duomenų bazė (HGMD)
http://www.hgmd.cf.ac.uk/ac/
Žmogaus genų mutacijų duomenų bazė (HGMD®) yra bandymas sulyginti žinomus (paskelbtus) genų pažeidimus, atsakingus už žmogaus paveldimas ligas.
NHLBI Exome Sequencing Project (ESP) Exome Variant Server
http://evs.gs.washington.edu/EVS/
NHLBI GO Exome Sequencing Project (ESP) tikslas – atrasti naujus genus ir mechanizmus, prisidedančius prie širdies, plaučių ir kraujo sutrikimų, pradedant naujos kartos žmogaus genomo baltymus koduojančių regionų sekos taikymą įvairiose, turtingose fenotipo populiacijas ir dalytis šiais duomenų rinkiniais bei išvadomis su mokslo bendruomene, siekiant išplėsti ir praturtinti širdies, plaučių ir kraujo sutrikimų diagnostiką, valdymą ir gydymą.
http://ghr.nlm.nih.gov/
Genetics Home Reference yra Nacionalinės medicinos bibliotekos svetainė, skirta vartotojams gauti informaciją apie genetines sąlygas ir su tomis ligomis susijusius genus arba chromosomas.
http://www.ncbi.nlm.nih.gov/books/NBK1116/
„GeneReviews“ yra ekspertų parengti, recenzuojami ligų aprašymai, pateikiami standartizuotu formatu ir orientuoti į kliniškai svarbią ir medicininiu požiūriu veiksmingą informaciją apie pacientų ir šeimų, turinčių specifines paveldimas ligas, diagnozę, valdymą ir genetinį konsultavimą.
Pasaulinis Alzheimerio asociacijos interaktyvusis tinklas (GAAIN)
http://www.gaain.org/
Pasaulinis Alzheimerio asociacijos interaktyvusis tinklas (GAAIN) yra bendradarbiavimo projektas, kuris suteiks tyrėjams visame pasaulyje prieigą prie didžiulės Alzheimerio ligos tyrimų duomenų saugyklos ir sudėtingų analitinių įrankių bei skaičiavimo galių, reikalingų dirbti su šiais duomenimis. Mūsų tikslas yra pakeisti mokslininkų darbo būdą, kad atsakytų į pagrindinius klausimus, susijusius su Alzheimerio ir kitų neurodegeneracinių ligų priežasčių supratimu, diagnozavimu, gydymu ir prevencija.
2013 m. gauti WGS duomenys apie didžiausią 800 Alzheimerio liga sergančių pacientų grupę
Genominės epidemiologijos širdies ir senėjimo tyrimų grupės (CHARGE) konsorciumas
http://web.chargeconsortium.com/
Genominės epidemiologijos širdies ir senėjimo tyrimų kohortų (CHARGE) konsorciumas buvo sudarytas siekiant palengvinti genomo masto asociacijos tyrimo metaanalizę ir replikacijos galimybes daugelyje didelių ir gerai fenotipuotų išilginių kohortų tyrimų. Jie taip pat turi DNR metilinimo duomenis kartu su WGS ir Exome Seq.
NIMH psichikos sutrikimų bendradarbiavimo genomikos tyrimų centras
Rezultatai
Išsamus epigenominis profiliavimas tiek BLCA linijose, tiek pirminiuose navikuose
Šiame projekte atlikome RNA-Seq, ChIP-Seq histono 3 lizino 27 acetilavimui (H3K27ac), transpozazei prieinamo chromatino tyrimą naudojant sekos nustatymą (ATAC-Seq) ir genomo chromatino patvirtinimo fiksavimo eksperimentus (Hi-C). 4 šlapimo pūslės vėžio ląstelių linijose (1a pav.), iš kurių dvi (RT4 ir SW780) anksčiau buvo anotuotos kaip luminalinės, o kitos dvi (SCABER ir HT1376), kurios buvo apibūdintos kaip bazinės [8, 25]. Remdamiesi šiame tyrime sugeneruotais RNR-Seq duomenimis, naudojome anksčiau aprašytą molekulinio potipių nustatymo metodą [26], kad patvirtintume priskyrimą prie luminalinės ir bazinės būsenos. Mūsų rezultatai patvirtino, kad RT4 ir SW780 priklauso Luminal-papillary potipiui, o SCABER ir HT1376 priklauso baziniam / plokščiajam potipiui (1 papildomas failas: S1 lentelė). Kiekvienas eksperimentas su šlapimo pūslės vėžio ląstelių linijomis turi bent du biologinius pakartojimus (2 papildomas failas: S2 lentelė) ir mes pastebėjome didelę koreliaciją tarp dviejų pakartojimų (3 papildoma byla: S3 lentelė). Dar svarbiau, kad tą patį eksperimentų rinkinį atlikome ir su keturiais pacientų raumenis invaziniais šlapimo pūslės navikais. Naudodami tą patį molekulinio potipio nustatymo metodą, nustatėme jų potipius taip: T1 yra šviesinis papiliarinis, T3 yra daug stromos, o T4 ir T5 yra baziniai / plokščiai.
Luminaliniai ir baziniai transkripcijos BLCA potipiai yra susiję su skirtingu promotoriaus ir distalinio stipriklio aktyvumu epigenetiniu lygiu. a Bendras tyrimo planas. b Diferencinės ekspresijos genų (DEG) analizė luminalinių ląstelių linijų (RT4 ir SW780) ir bazinių ląstelių linijų (SCABER ir HT1376) rodo 427 baziniam specifiniam padidinto reguliavimo genus ir 524 luminalinius specifinius padidintus genus. c Diferencialinio H3K27ac ChIP-Seq šilumos žemėlapis promotoriuose (kairėje). Signalo H3K27ac intensyvumo profiliai kiekvienam BLCA ląstelių klasteriui (dešinėje). d Genomo naršyklės signalų takeliai luminalinių ir bazinių genų skydui. Čia rodomi H3K27ac ChIP-Seq, ATAC-Seq ir RNA-Seq duomenų takeliai RT4, SW780, SCABER ir HT1376 ląstelėse. e Promotorius H3K27ac ir su juo susiję RNR-Seq signalai pasirinktiems luminaliniams ir baziniams genams rodo nepaprastą panašumą. f Integruotos H3K27ac smailės distaliniuose stiprikliuose ir RNR-Seq genų ekspresijos asociacijos modelis identifikuoja numanomus stipriklius ir genų reguliavimą. 10 000 geriausių kintamiausių stiprintuvų (kairysis šilumos žemėlapis) pavaizduoti kartu su atitinkama genų ekspresija (dešinysis šilumos žemėlapis). g Genomo H3K27ac signalų koreliacijos tarp šlapimo pūslės vėžio ląstelių linijų ir naviko mėginių rodo stipriklio kraštovaizdžio panašumą
Luminaliniai ir baziniai transkripcijos BLCA potipiai yra susiję su skirtingu promotoriaus ir distalinio stipriklio aktyvumu epigenetiniu lygiu
H3K27ac signalų praturtinimas buvo naudojamas nuspėti tiek aktyvius promotorius, tiek distalinius stipriklius [27, 28]. Todėl pirmiausia atlikome ChIP-Seq H3K27ac visuose keturiuose ląstelių tipuose ir keturiuose pacientų mėginiuose. Pastebėjome, kad biologiniai pakartojimai po H3K27ac ChIP-seq visada susibūrė kartu, o tai rodo, kad mūsų rezultatai yra labai atkuriami (4 papildomas failas: S1A pav.). Be to, mes nustatėme, kad du luminaliniai potipiai (RT4 ir SW780) susitelkė kartu, o dvi bazinės (SCABER ir HT1376) ląstelių linijos taip pat yra sugrupuotos (4 papildomas failas: S1A pav.). Šie grupavimo rezultatai rodo, kad pasauliniai epigenominiai profiliai tiksliai atspindi ląstelių tapatybę. Ląstelių linijų hierarchinė grupuotė, pagrįsta H3K27ac signalais, taip pat buvo atspindėta pasaulinės mRNR ekspresijos pagal RNR-Seq duomenis (4 papildomas failas: S1B pav.). Atlikome diferencinę genų ekspresijos analizę dviejose ląstelių tipų grupėse (RT4 ir SW780, palyginti su SCABER ir HT1376) ir nustatėme 427 bazinius specifinius (5 papildomas failas: S4 lentelė) ir 524 luminalinius genus (1b pav., Papildomas failas). 6: S5 lentelė).
Toliau mes ištyrėme promotoriaus naudojimą, pagrįstą H3K27ac signalais žinomuose genuose. Patvirtinome, kad promotoriaus H3K27ac intensyvumas yra labai panašus į genų ekspresiją (1c pav.), o klasterizacijos analizė, pagrįsta promotoriaus H3K27ac intensyvumu, galėjo atskirti luminalinius ir bazinius BLCA modelius (4 papildomas failas: S1C pav.). Pavyzdžiui, mes pastebėjome, kad dvi luminalinio potipio BLCA ląstelių linijos RT4 ir SW780 turi panašius H3K27ac modelius luminaliniuose genuose FOXA1, GATA3, ir PARG (1d, e pav.), o dvi bazinių ląstelių linijos turi panašius promotoriaus ženklus genuose, koduojančiuose bazinius / plokščius žymenis KRT5/14. Įdomu tai, kad nors remiantis pasauline genų ekspresija, HT1376 yra klasifikuojamas kaip bazinis / plokščiasis potipis, jis rodo panašų promotoriaus H3K27ac modelį luminaliniuose genuose (GATA3, KRT7/8/18, 1e pav.).
Distalinės H3K27ac smailės iš genų promotoriaus regionų buvo naudojamos kaip aktyvių stipriklių žymenys [27, 29]. Mes pasirinkome tą patį metodą ir vidutiniškai prognozavome 59 466 (40 731–78 506) stipriklius kiekvienoje ląstelių linijoje (7 papildomas failas: S6 lentelė). Norėdami susieti distalinius stipriklius su jų tiksliniais genais, atlikome koreliacija pagrįstą distalinio stipriklio smailės ir genų asociaciją, kaip aprašyta [30], ir nustatėme 10 000 geriausių kintamųjų distalinių stiprintuvų, kurie rodo reikšmingą koreliaciją su susietu genu (koreliacija ≥0,5, p < 0,01 iš viso 58 509 atitiko mūsų kriterijus. 1f pav. ir 8 papildoma byla: S7 lentelė). Pastebėjome, kad stiprikliai rodo aiškią grupavimą pagal skirtingus ląstelių tipus, o jų tiksliniai genai rodo panašius ląstelių tipui būdingus modelius (1f pav. ir 4 papildomas failas: S1D pav.). Be to, norėdami suprasti klinikinę mūsų išvadų svarbą, atlikome H3K27ac ChIP-Seq keturiuose raumenų invazinių šlapimo pūslės pacientų mėginiuose. Mūsų rezultatai rodo nepaprastą naviko ląstelių linijų koreliaciją (1g pav.). Apibendrinant, šiose ląstelių linijose ir ribotoje naviko grupėje parodome, kad epigenetinis reguliavimas yra susijęs su molekulinio potipio priskyrimu.
Skirtingi transkripcijos faktoriaus motyvų rinkiniai yra praturtinti luminaliniu ir baziniu BLCA susijusiu cis DNR reguliavimo sritys
Mes atlikome ATAC-Seq RT4, SW780, SCABER ir HT1376 ląstelių linijose, kad įvertintume jų atvirą chromatino būklę genome. Vidutiniškai kiekvienoje ląstelių linijoje nustatėme 32 000 atvirų chromatino sričių (2a pav. ir 9 papildomas failas: S8 lentelė). Tarp jų 40, 8% atvirų chromatino sričių buvo promotoriaus regionuose, o 59, 2% - distaliniuose regionuose. Apskritai > 90 % atvirų chromatino promotoriaus sričių sutampa su H3K27ac (4 papildomas failas: S2A, S2C–D pav.). Distalinių ATAC-Seq smailių ir H3K27ac sutapimas yra mažesnis (4 papildomas failas: S2A paveikslas ir 10 papildomas failas: S9 lentelė), bent iš dalies dėl skirtingo smailių skaičiaus skirtinguose duomenų rinkiniuose. ATAC-Seq genomo koreliacija parodė, kad HT1376 ir SCABER susitelkė 80% panašumo (4 papildomas failas: S2E pav.), palyginti su luminal RT4 (
65 proc.). Pastebėjome, kad šis stebėjimas atitinka RNA-Seq pagrįstą grupavimą ir H3K27ac pagrįstą grupavimą (4 papildomas failas: S1A ir B paveikslai).
Skirtingi transkripcijos faktoriaus motyvų rinkiniai yra praturtinti luminaliniu ir baziniu BLCA susijusiu cis DNR reguliavimo sritys. a Išsamus ir aiškus distalinių ATAC-Seq signalų rinkinys trijose klasteriuose (specifinis šviestuvas, bazinis specifinis ir bendrinamas) ir atitinkami H3K27ac signalai. b TF motyvų analizės rezultatai čia rodomi kaip surikiuotas sklypas (kairėje) ir motyvai (dešinėje), kur būdingi šviesai (viršuje) ir baziniam plokščiajam specifiniam atviro chromatino stiprikliui (apačioje). c FOXA1 ir GATA3 surišti atviri chromatinai, esantys distaliniuose RT4 / luminalinės ląstelių linijos stiprikliuose, čia pavaizduoti trijose grupėse: tik FOXA1, tik GATA3 ir FOXA1 ir GATA3 surišimo vietos. d Kiekvienos surišimo vietų grupės (tik FOXA1, FOXA1 ir GATA3 ir GATA3) kelių genų ontologijos analizė. e Pastebėtas TF motyvų (AP-1, FOX Forkhead ir GATA) atsiradimas čia parodytas trijų grupių distaliniuose stiprikliuose ir promotoriuose. f Atviri BLCA ląstelių linijų genomo chromatinai yra panašūs į TCGA šlapimo pūslės navikus [30]
Toliau atlikome šių atvirų chromatino sričių motyvų analizę (11 papildomas failas: S10 lentelė). Pastebėjome, kad CTCF ir AP-1 komplekso surišimo vietos yra praturtintos visose ląstelių linijose (2b pav. ir 4 papildomas failas: S2G pav.). Tolesnis TF motyvų reitingavimas pagal sodrinimą p-vertė atskleidė, kad luminalinės atviros chromatino sritys (bendrosios tarp RT4 ir SW780) buvo praturtintos GRHL2, TP53 ir TP63 surišimo motyvais, o baziniai atvirieji chromatinai (dalijami tarp SCABER ir HT1376) buvo praturtinti TEAD1/4 ir KLFb faktoriumi (KLFig. ) įrišimo motyvai. Anksčiau buvo pranešta, kad GRHL2 [31] yra luminalinis genas, o tai patvirtina mūsų išvadas. Įdomu tai, kad AP-1 kompleksinių baltymų FOSL1/2, JUN/JUNB, ATF3 ir BATF TF [32] surišimo motyvai buvo labiausiai praturtinti tiek luminalinių, tiek bazinių plokščių atvirų chromatinų motyvai. Tada mes išsamiai suskirstėme visus praturtintus TF motyvus luminaliniuose, baziniuose plokščiuose ir bendruose atviruose distalinių stiprintuvų chromatinuose, kad ištirtume ryšį tarp TF ir BLCA potipių (11 papildomas failas: S10 lentelė). Mes nustatėme, kad distaliniuose stiprikliuose luminaliniai BLCA potipiai yra susiję su anksčiau praneštais steroidinių hormonų receptorių TF. Kita vertus, bazinės ir plokščios atviros chromatino sritys stiprintuvuose rodo anksčiau nepaskelbtų veiksnių praturtėjimą MADS dėžutėje TF MEF2C ir homeobox TF OTX2. Nenuostabu, kad luminaliniai novatoriški TF, tokie kaip šakės galvutės transkripcijos faktoriai (FOXA1/2/3, FOXF1, FOXK1, FOXM1) ir GATA TF (GATA3/4/6), buvo praturtinti su šviesa susijusiais stiprikliais, turinčiais atvirą chromatino konformaciją. Dar labiau stebina tai, kad šakutės galvutės ir GATA motyvai taip pat buvo nustatyti kaip susiję su atviru chromatinu stiprinimo elementuose visose ląstelių linijose (11 papildomas failas: S10 lentelė). Nors žinoma, kad FOXA1 ir GATA3 ekspresija yra maža bazinės šlapimo pūslės vėžio ląstelių linijose ir navikuose, šakutės galvutės ir GATA motyvų praturtėjimas atviruose chromatinuose visoje BLCA ląstelių linijose rodo, kad kompensacija yra Forkhead ir GATA faktoriai, išskyrus FOXA1 ir GATA3. Be to, šakutės galvutės ir GATA motyvų praturtėjimas tarp ląstelių linijų atviro chromatino srityse gali reikšti, kad luminalams būdingi TF yra pasirengę prisijungti prie šių atviro chromatino sričių. Be to, žinoma, kad FOXA1 ir GATA3 vaidina svarbų vaidmenį kuriant urotelį [31], o tai rodo, kad jų surišimo vietos gali būti paruoštos ankstyvame vystymosi etape. Taip pat išsiaiškinome, kad su kamieninėmis ląstelėmis susiję novatoriški TF, tokie kaip KLF faktoriai (KLF10/14), ATF faktoriai (ATF1/2/4/7) ir NANOG, buvo praturtinti su baziniais stiprintuvais. Tai įdomu, nes baziniame urotelyje egzistuoja progenitorinių ląstelių populiacija, kuri gali prisidėti prie urotelio vystymosi ir diferenciacijos [33, 34].
FOXA1 ir GATA3 jungiasi prie luminalinių atvirų chromatinų prie reguliavimo distalinių stiprintuvų, kad paskatintų luminalinių specifinių genų ekspresiją
Iškėlėme hipotezę, kad TF, tokie kaip FOXA1 ir GATA3, jungiasi prie atviros chromatino srities prie pirmųjų luminalinių stiprintuvų ir suaktyvina susijusią genų ekspresiją. Norėdami patikrinti šią hipotezę, atlikome GATA3 ChIP-Seq RT4 luminalinėje BLCA ląstelių linijoje ir gavome FOXA1 ChIP-Seq RT4 ląstelėse iš anksčiau paskelbto darbo (12 papildomas failas: S11 lentelė) [8]. Kaip buvo prognozuota, luminaliniai TF FOXA1 ir GATA3 parodė praturtintą jungimąsi prie atvirų chromatino lokusų, susijusių su liuminiu (FOXA1, GATA3, PARG, FGFR3, ir FABP4) distaliniai stiprikliai (2c pav.). Tiksliau, mes atradome 1325 distalinius stipriklius, kurie rodo FOXA1 ir GATA3 jungtį RT4 (2c pav.). Panašiai FOXA1 ir GATA3 parodė praturtintą jungimąsi prie atvirų luminalinių žymenų genų chromatino lokusų (FOXA1, ERBB3, KRT19, GPX2, ir FABP4) promotoriai (4 papildomas failas: S2F pav.).
Genų, esančių arti šių distalinių stiprinimo vietų, GO termino analizė parodė, kad TGF beta gamyba, epitelio vystymasis, transkripcijos reguliavimas, susijęs su ląstelių likimu, ir ląstelių ir ląstelių adhezijos biologiniai procesai (kadherino surišimas ir adherenų jungties surinkimas) kaip terminai, susiję su FOXA1 . Be to, ląstelių komponento, ląstelės dydžio ir viršūninės plazmos membranos biologinių procesų reguliavimas buvo terminas, identifikuotas su GATA3 surištais genais, esančiais arti šių distalinių stiprintuvų, o tai rodo stiprų abiejų TF įsitraukimą į ląstelių likimą ir luminalinę diferenciaciją (2d pav. ). Kalbant apie proksimalinius genus, susijusius su distaliniais stiprikliais, surištais FOXA1 ir GATA3, nustatyti terminai buvo susiję su įvairiais vystymosi procesais ir gleivių sekrecijos bei riebalų ląstelių diferenciacijos reguliavimu, kurie abu svarbūs diferencijuoto urotelio metaboliniai požymiai (2d pav.).
Tada tęsėme tik FOXA1, tik GATA3 ir kartu susietų svetainių motyvų analizę. Keista, bet AP1 kompleksai buvo specialiai praturtinti visais distaliniais stiprikliais, be FOXA arba GATA motyvų (2e pav.). Šių trijų veiksnių susiejimo tvarka dar turi būti ištirta. Galiausiai, norėdami suprasti klinikinę mūsų išvadų svarbą, palyginome keturias BLCA ląstelių linijas su TCGA raumenis invazinio šlapimo pūslės naviko ATAC-Seq duomenimis [30] ir išsiaiškinome, kad mūsų ląstelių linijų genomo pločio atviras chromatino profilis yra sutelktas skirtingos navikų sankaupos (2f pav.), o tai rodo, kad atviros chromatino sritys šiose ląstelių linijose turi panašius modelius su pacientų navikais.
Luminaliniai ir baziniai BLCA potipiai rodo potencialiai skirtingas 3D genomo organizacijas
Ankstesni tyrimai parodė, kad 3D chromatino organizacija yra susijusi su epigenetiniu genų aktyvavimu arba nutildymu ląstelėse [35]. Pavyzdžiui, žinoma, kad didžioji dalis heterochromatino yra suspausta branduoliuose ir yra šalia su sluoksniu susijusios branduolio apvalkalo periferijos [35]. Norėdami gauti pradinių įžvalgų apie luminalinio ir bazinio BLCA genomą apimantį 3D kraštovaizdį, atlikome didelės skiriamosios gebos Hi-C eksperimentus su visomis keturiomis ląstelių linijomis (kiekviena mažiausiai 800 M nuskaitymo) ir penkiais šlapimo pūslės naviku sergantiems pacientams (> 800 M rodmenų). , kiekvienas) (4 papildomas failas: S3 pav.). Naudojome neseniai sukurtą programinę įrangą Peakachu [36], kuri yra mašininiu mokymusi pagrįstą chromatino kilpos aptikimo metodą, norėdami numatyti kilpas esant 10 Kb bin skyrai. Pirma, keturiose ląstelių linijose nustatėme vidutiniškai 56 315 kilpų (diapazonas nuo 38 271 iki 69 032) (prob> 0,8 13 papildomas failas: S12 lentelė). Tada, naudodami Peakachu išvestą tikimybių balą, priskyrėme potipiui būdingas chromatino kilpas, kaip parodyta bendroje smailių analizėje (APA, 3a pav. ir 14 papildomas failas: S13 lentelė) [37]. Remdamiesi savo požiūriu, RT4 ir SW780 (2299) pastebėjome daugiau potencialiai specifinių luminalinių kilpų, palyginti su baziniais BLCA modeliais SCABER ir HT1376 (2144). Tada palyginome kiekvieną iš šių kategorijų su kilpomis, aptiktomis penkiuose pacientų mėginiuose (3b pav.):
Šiuose penkiuose naviko mėginiuose buvo pastebėta 30–40% luminaliniu ir baziniu būdu priskirtų 3D chromatino kilpų, nustatytų ląstelių linijose.
Luminaliniai ir baziniai šlapimo pūslės vėžio potipiai rodo potencialiai skirtingas 3D genomo organizacijas. a Šviesos ir bazinių plokščių ląstelių linijų Hi-C kilpos analizė rodo skirtingas šviesines kilpas ir bazines plokščias kilpas. b Kontaktai, nustatyti luminalinėse ir bazinių plokščiųjų ląstelių linijose, yra dalijami ir patvirtinami penkiuose šlapimo pūslės vėžio naviko mėginiuose. c Čia rodomi pasirinkto luminalinio geno (FOXA1) ir bazinio geno (KRT5), kuriuose yra stipriklio ir promotoriaus kilpų, genomo naršyklės takeliai. Lankai rodo numatomas chromatino kilpas naudojant Hi-C duomenis. d Rodomas kontaktų tipas, pagrįstas kontakto vietos sutapimu stiprintuve (H3K27ac distaliniame regione) arba promotoriuje (H3K27ac ir H3K4me3 promotoriuje) kiekvienoje ląstelių linijoje. E-P, stipriklio-promoterio kilpos E-E, stipriklio-stiprintuvo kilpos P-P, promotoriaus-promoterio kilpos E-N, stipriklio-nereguliacinės kilpos P-N, promotoriaus-nereguliacinės kilpos Nėra, nereguliacinės kilpos. e FOXA1 (kairė ašis) ir GATA3 (dešinė ašis) surišimo vietų praturtinimas RT4 (luminalinėse) ląstelėse parodytas jo kilpos inkaruose
Galiausiai kiekvienoje kategorijoje ištyrėme stipriklio ir promotoriaus kilpas, kad jos būtų susijusios su specifiniam potipiui būdinga genų ekspresija. Pavyzdžiai pateikti 3c pav., kuriame mes nustatėme, kad luminalinis genas FOXA1 ir bazinis genas KRT5 parodė padidėjusį stipriklio-promotorių kilpų skaičių atitinkamai luminalinėse ir bazinėse ląstelių linijose. Apskritai mes tai pastebėjome
40 % chromatino kilpų yra tarp stiprintuvų ir promotorių (3d pav.). Be to, šiuose kilpos inkaruose nustatėme reikšmingą FOXA1 ir GATA3 surišimo vietų praturtėjimą, o tai rodo, kad šie pionierių veiksniai dalyvauja reguliuojant 3D genomą (3e pav.). Ši išvada sutampa su ankstesniais tyrimais, kuriuose pranešama apie FOXA1 surišimo vietų praturtėjimą stipriklio-promotoriaus kilpose [38].
Kopijų skaičiaus variacija (CNV) ir chromatino kilpos sergant šlapimo pūslės vėžiu
Vėžio požymis yra dideli struktūriniai variantai (SV), apimantys inversijas, ištrynimus, dubliavimus ir translokacijas. Neseniai buvo įrodyta, kad CNV ir SV pokyčiai gali sukelti 3D genomo struktūros pokyčius, įskaitant naujų topologiškai susijusių domenų ("neo-TAD") susidarymą [39] ir dėl to atsirandantį "stiprintuvo užgrobimą" [40]. Neo-TAD nurodo scenarijus, kai SV įvykis sukelia naujų chromatino domenų susidarymą, o tai savo ruožtu gali paveikti tuose regionuose esančių genų ekspresijos profilius. Taikant „stiprintuvo užgrobimo“ modelį, pakeista 3D genomo organizacija sukelia nenormalią stiprintuvo sąveiką, o stiprintuvai yra arti netinkamo tikslinio geno (dažniausiai onkogeno), todėl taikinys aktyvuojamas netinkamai.
Pirmiausia sistemingai nustatėme kopijų skaičiaus variantus (CNV) ir SV įvykius, naudodami Hi-C duomenis su HiNT [41] ir Hi-Cbreakfinder [42] programine įranga. Mes nustatėme dešimtis didelių SV, įskaitant inversijas, trynimus ir perkėlimus (4a, b pav., 4 papildomas failas: S4–S5 paveikslai, 15 papildomas failas: 14 lentelė). Kaip ir galima tikėtis, pacientų mėginiuose stebėjome mažiau CNV nei ląstelių linijose. Dar svarbiau, kad sugebėjome iš naujo sukurti vietinį Hi-C žemėlapį, supantį SV lūžio taškus. Šiuose vietiniuose Hi-C žemėlapiuose galime stebėti įdomius stipriklio užgrobimo įvykius ir neo-TAD susidarymą (4c – h pav.). These observations provide an important resource to further study the function of the re-arranged enhancers in the context of bladder cancer.
Chromatin interactions induced by structure variation (SV) events. a, b Circos plot showing intra- and inter-chromosome SVs in SCABER (a) and SW780 (b). c A large intra-chromosomal translocation on chr9. d–h Inter-chromosomal translocations. The breakpoints were identified by the HiCBreakfinder software. We then reconstructed the local Hi-C maps across the breakpoints. RNA-Seq and H3K27ac ChIP-Seq tracks from the same cell type are shown below the Hi-C maps
Neuronal PAS Domain Protein 2 (NPAS2) is a novel luminal BLCA TF which regulates luminal gene expression and cell migration
Genome-wide open chromatin analysis of BLCA cell lines provides an ideal platform for the identification of novel transcriptional regulators of BLCA cell fate and phenotype. Here we performed motif analysis of luminal-associated, basal-associated, and shared open chromatin regions, resulting in the identification of distinct TFs in each cluster. Among them, many represent known families of subtype-specific regulators, such as the GATA, FOX, and ETS families at luminal-associated ATAC-Seq peaks. Among them, we noticed a potential novel bHLH containing regulator, NPAS2, which is enriched in the luminal-associated and shared clusters, but not enriched in basal-associated ATAC-Seq peaks (Fig. 5a). We examined its binding profile using the latest ENCODE data (HEPG2 cells) [43] and found that NPAS2 binds at the FOXA1 promoter region (Fig. 5b), but not at regulatory regions for basal marker genes. This suggests the possibility that NPAS2 may be an upstream regulator of FOXA1. We then checked the TCGA data and found that high expression level of NPAS2 is significantly correlated to overall patient survival (Fig. 5c).
NPAS2 is a novel bladder cancer regulator. a p-values of NPAS2 motif in luminal-associated (RT4, SW780), basal-associated (SCABER, HT1376), and shared open chromatin regions. b NPAS2 ChIP-seq signal near luminal marker genes FOXA1, GATA3, ir PPARG in HEPG2 cell line. c NPAS2 Kaplan-Meier curve is shown here for 2000 days with log-rank statistics and hazards ratio. d Transwell migration assay representative crystal violet staining (left) and quantification of differences in transwell migration (right) are shown following overexpression of NPAS2 in SCABER. e RT-qPCR results for basal marker genes KRT5, KRT6A, STAT3, ir TFAP2C are shown here for wild-type and NPAS2 overexpressed SCABER basal cell line. f NPAS2, FOXA1/GATA3, ir PPARG RT-qPCR are shown here for wildtype and FOXA1/GATA3 overexpressed SCABER basal cell line
To further determine whether NPAS2 expression influences the downstream target expression and phenotype, we overexpressed NPAS2 in the basal-squamous BLCA cell line SCABER. First, we performed trans-well migration assays and found that overexpression of NPAS2 in SCABER cells decreased cell trans-well migration (Fig. 5d). We then performed RT-qPCR experiments and found that the basal marker genes (such as KRT5, KRT6A, ir TFAP2C) are significantly downregulated (Fig. 5e) following NPAS2 overexpression, suggesting NPAS2 represses the expression of a subset of basal marker genes.
Because our functional genomics analysis suggests that FOXA1 and GATA3 cooperate to regulate luminal target genes [8], we individually overexpressed FOXA1 and GATA3 in SCABER cells to test their ability to regulate NPAS2 expression. We observed increased expression of NPAS2 by both FOXA1 and GATA3 overexpression (Fig. 5f).
Discussions
Advances in single-cell technologies present new challenges and opportunities for making biological discovery. Single-cell studies often involve large numbers of cells, which are powerful at characterizing cellular heterogeneity, but small numbers of biological samples, which are underpowered for discovering common disease genes. It has been shown by recent genome-wide association analysis that it is possible to enable new discovery by performing association analysis at cell-type resolutions [55]. For cancer and genetic diseases driven by somatic mutations, being able to obtain genetic footprint at various time and conditions can enable discovery of genes responsible for disease progression and resistance to therapy.
However, it remains unclear what analytical strategies should be deployed to achieve the benefits. Even more challenging it gets when CNAs are being considered, as CNAs affect large regions of the genome and are difficult to trace using phylogenetics methods.
In our study, we demonstrated that it is possible to achieve the benefit by reconstructing copy number evolution history as a lineage tree, i.e., MEDALT, and performing permutation-based statistical analysis, i.e., LSA, to identify fitness-associated CNAs and genes.
We have learned several important lessons in our study.
First, it is important to perform accurate lineage tracing. Although the single-copy gain and loss model that we implemented in deriving MEDALTs is limited in complexity, it already performed substantially better than conventional phylogenetics algorithms such as MP that assumes infinite sites and NJ that employs naïve distance metrics, as shown in our simulation and in real data analysis. It is conceivable that further development of methodology that incorporates more complex genome evolution mechanisms such as chromothripsis [56] can lead to better results.
An important goal was to represent convergent evolution that is likely prevalent in the lens of CNAs [10, 57]. Conventional phylogenetics algorithms strictly prohibit the expression of convergent evolution by disallowing an alteration to occur multiple times in a course of evolution [28]. Several new algorithms relaxed such limitation but were designed for analyzing point mutation data [58]. As shown in our analysis of the TNBC patients, genes identified based on convergent evolution analysis (i.e., PLSA) had an even higher fraction of known cancer genes than those identified based on cohort-level single-lineage LSA. Our result suggests that examining convergent evolution is likely a key component towards fully unleashing the power of single-cell studies.
Unlike canonical phylogenetic trees, MEDALTs are minimal spanning trees that do not contain unobserved internal ancestral nodes. Representing evolution using minimal spanning trees instead of phylogenetics trees was our deliberate choice, as it allowed us to develop polynomial-runtime solutions that are scalable to real datasets containing thousands of cells. It also allowed us to conveniently implement biologically meaningful MED and enforce directionality constraints. Phylogenetics algorithms are likely effective when the numbers of cells are small and that the alterations are simple to trace. None of these conditions apply to available SCCN datasets that have CNAs evolving non-linearly in hundreds of cells. Moreover, we have shown in our simulation that for the purpose of detecting fitness-association alterations, our method outperformed phylogenetics approaches in a wide range of sample sizes.
A particular challenge in developing and evaluating computational lineage tracing methods is the lack of exact ground truth. Although various experimental technologies have been developed [59, 60], we are not aware of any that can be applied to trace copy number evolution in patient samples. To circumvent this, we utilized in silico simulation that mimics several prevalent CNA mechanisms to evaluate the accuracies of the reconstructed lineages and fitness-associated alterations. We also utilized longitudinal datasets on which we knew the biological stages of the cells to evaluate the chronological accuracy of the inference results. Although these strategies are unlikely sufficient to validate all the edges and lengths in the trees, they are objective and sufficient to discriminate various approaches.
Second, it is important to control biases in statistical inference. It is challenging to detect fitness-associated genes, as CNAs often affect a large number of genes and that the sample sizes are often small. Passenger CNAs that occur naturally in non-functional regions such as those near fragile sites or repeats could easily cloud the discovery. In addition, lineage tracing algorithms are unlikely to be perfect and could introduce distinct biases. To address these challenges, we employed LSA, which randomly permutes SCCN profiles into different cells to reduce the biases introduced by background genomic variations and technical noises. And we reconstructed trees from permutated datasets to alleviate biases introduced by the lineage tracing algorithms. The evolutionarily meaningful MED metrics and constraints help our analyses to focus on biologically relevant hypotheses, given limited computational resources. These procedures appeared important to achieve the accuracy. Further exploration of different ways to permute the data and to estimate the background distribution will likely lead to better results.
We assessed the functional impact of the identified genes using cell-line CRISPR essentiality screen data. We confirmed that the set of fitness-associated, amplified genes discovered by our methods are significantly more essential than other control gene sets in cancer cell lines. We also nominated novel genes that appear to have prognostic values in TCGA and the METABRIC datasets. These assessment strategies likely have false positives and negatives. Further comprehensive, well-controlled and targeted experiments will likely be required to fully assess the functional impact and clinical values of these genes.
Lastly, it was exciting to observe benefits of our methods on both the scDNA-seq and the scRNA-seq data. Although RNA-derived copy number profiles may not be as accurate as those derived from DNAs, previous studies [61] suggested that they can reasonably distinguish tumor clones. Our study further revealed the value of scRNA-seq data in lineage tracing and supported the notion that genomic profiles, even approximations, are more accurate than transcriptomic profiles in determining biological timing of cells. Our results opened doors towards utilizing scRNA-seq as a platform to understand genetics underlying developmental processes and perform gene discovery.
IŠVADA
The number of users proves that MEXPRESS, through its ease of use and unique, integrative data overview, found its place in the toolbox of many researchers. By combining a comprehensive visualization and statistical analysis in a single figure, MEXPRESS helps researchers quickly identify dysregulations and their clinical relevance in cancer. With this major, feedback-driven update, we aim to consolidate MEXPRESS’s place in the set of open source web tools available to researchers and clinicians.
Metodai
Haploproficient genes and orthology analysis
The set of S.cerevisiae genes which are haploproficient in turbidostat culture was obtained using the growth data of [8] and an FDR cutoff of 0.02. This stringent FDR cut-off rigorously defines those genes for which heterozygosity confers a strong fitness advantage, but has no effect on the functional enrichment of genes identified as haploproficient. Genes defined as ‘haploproficient’ for the purposes of this study are listed in Additional file 1: Table S1. The set of chromosome maintenance-associated HP genes described in [8] overlaps, but is not coincident, with the HPGI set studied here, since the current set also includes DNA damage-response genes.
Orthology assignments were made using the InParanoid algorithm [50] and compared with the results of a BLAST [51] reciprocal best-hits search. GO enrichment searches were performed using the Babelomics 4 FatiGO tool [52]. To assess the significance of HP gene conservation, the number of HP genes having orthologs in a given Ascomycete species, given the number of S. cerevisiae HP genes, was compared against the whole-genome conserved proportion using a χ 2 or Fisher exact test (depending on sample size), with the null hypothesis of identical distribution. All findings of significance were reiterated using a Z test for difference of proportions. Where necessary, P values were corrected for multiple testing using the Bonferroni correction. Cell cycle and DNA damage repair pathways were obtained from the KEGG pathway database [53].
Expression data for S.cerevisae genes was obtained from the Saccharomyces Genome Database [54] and protein expression levels from [55]. A list of human cancer genes/oncogenes was obtained from the Cancer Gene Index [17] enrichment of HP genes amongst the orthologs was determined using a χ 2 test as above. CNV incidence across eight tumour types (breast invasive carcinoma, rectum adencarcinoma colon adenocarcinoma, kidney renal cell clear carcinoma, uterine corpus endometrioid carcinoma, glioblastoma multiforme, acute myeloid leukemia, lung adenocarcinoma, lung squamous cell carcinoma, serous cystadenocarcinoma) as measured by comparative genomic hybridisation, was obtained from the NCI Cancer Genome Atlas online data browser [17] with a copy number (log2 ratio) of magnitude >0.5 taken as the significance threshold. Details of the sampling and analysis of the tumour samples are described in [17]. A P-value for HP ortholog overrepresentation was calculated using a χ 2 test .The TGCA database was also used to perform a pathway search for overrepresentation of HP orthologs.
Yeast strains
In total, 30 HP genes were chosen for analysis, based upon the criteria discussed in the Results above. The heterozygous deletion mutant of each gene was obtained from the heterozygous diploid deletion library (Open Biosystems), in the BY4743 (MAT a /α, his3D1/his3D1, leu2D0/leu2D0, LYS2/lys2D0, met15D0/MET15, ura3D0/ura3D0) genetic background. For non-essential genes, the homozygous deletant was retrieved from the analogous homozygous diploid deletion library (Open Biosystems).
Control strains were the BY4743 WT, along with the heterozygous deletion mutant of the non-functional his3 locus the non-HP, non-cell cycle ho/HO heterozygous deletion strain and the heterozygous deletion mutant of the non-HP, cell cycle gene HSL1. In addition, heterozygous deletion mutants of the G1 and G2 cyclins were included in several of the experiments. A complete list of the strains used is provided in Additional file 6: Table S6.
Cell-cycle profiling
Flow cytometric analysis of the deletion strains’ cell cycle profiles was carried about following the method of [56]. Trumpai,
10 7 cells in mid-exponential phase were harvested, washed, and fixed in absolute ethanol at 4C overnight. Fixed cells were then collected, washed, and boiled for 15 minutes in 2 mg/mL RNAse in 50 mM Tris-Cl (pH 8), and incubated at 37C for 2–12 hours. Cells were resuspended in protease solution (5 mg/mL pepsin, 4.5 μL/mL concentrated HCl), incubated for 15 minutes at 37C and resuspended in 50 mM Tris (pH 7.5). For analysis, 50 mL of cell suspension was added to 1 mL of 1 mM Sytox Green in 50 mM Tris pH 7.5), vortexed and analysed using a Cyan flow cytometer (Beckman Coulter). FlowJo (Tree Star) analysis software was used to fit histograms to the peaks representing 1C and 2C DNA content, and thereby calculate the number of cells in the G1 and G2 phases, and infer the number in S phase from the remaining fraction of the population.
Chronological lifespan assay
Cultures were inoculated from frozen stocks, grown overnight in YPD at 3°C, and 200mL of each was transferred into a well of a 96-well microtiter plate (Corning). Strains were present in duplicate on each plate, with a buffer of WT in the wells around the edge of the plate, so edge effects would not impact test colony measurements. A Singer Rotor HDA colony pinning robot was used to spot four replicates of each well onto a YPD + 10 μg/mL phloxine B (Sigma) plate. Phloxine B is a fluorescein derivative taken up when the cell membrane is disrupted upon cell death [57]. Plates were incubated for 48 hours at 3°C and photographed using an Epson 1240 Scanner. The colony images were analysed using a custom image-analysis code written in MatLab, with colony size measured by pixel count, and fraction of dead cells by the intensity of colony redness [10]. Since these parameters are independent, this allowed the dissection of the effect of cell viability upon colony growth from that of growth rate variation. The 96-well liquid cultures were incubated at 3°C, and, every second day over a period of three weeks, the colony-pinning onto YPD + phloxine B and image analysis repeated. For each plate, the median culture intensity for each strain was compared with the growth of the WT on that plate, and also with the strain growth and viability after the initial 48-hour period. The experiment was performed twice.
At several points throughout the 3-week period, several strains were selected at random, and viability assayed by performing serial dilutions and counting colony-forming units. These results were checked for compatibility with the microplate viability results.
Apoptosis assays
The rate of occurrence of apoptosis in the different strain populations was measured in two ways. Apoptosis was first induced by pretreating cells with 0.001%, 0.01% MMS, 0.0001% or 0.001% TBHP in overnight culture keeping a negative, non-induced WT control sample.
The translocation of phosphatidyl serine to the cell surface, a marker of apoptosis [58], was measured using an Annexin V-FITC Apoptosis Detection kit. (Sigma). Cells were harvested, washed in 1.2M sorbitol, 0.5 mM MgCl2, 35 mM K phosphate (pH 6.8) and then digested in 5.5% glusulase (Sigma) and 15 U/mL lyticase (Sigma) for 2 hours at 28C. Spheroplasts were harvested, washed in binding buffer (10 mM Hepes/NaOH pH 7.4, 140 mM NaCl, 2.5 mM CaCl2 in 1.2 M sorbitol buffer) and resuspended in binding buffer/sorbitol. 5 mL of FITC-labelled annexin V, and 10 mL of 10010 mg/mL propidium iodide were added to each sample, with control samples containing 1.) no label, 2.) FITC-annexin V only, and 3.) PI only. Fluorescence was quantified using a CyAn (Beckman Coulter). Gates were fitted on the basis of the the control samples, dividing a log PI versus log FITC plot into four quadrants: lower left (neither FITC nor PI-stained) – viable cells upper left (PI stain only) – necrotic cells lower right (FITC only) – early apoptotic cells and upper right (PI and FITC-stained) – late apoptotic cells. FlowJo software (TreeStar) was used to count the fraction of the total cell population in each quadrant. The proportion of both necrotic and apoptotic cells for each strain was normalised to strain viability (i.e. on the basis of the proportion of cells assigned to the lower-left FITC/PI quadrant), and the ratio of necrotic:apoptotic cells calculated. Ratios for each strain were normalised to the WT value, and the standard deviation across all samples calculated. Strains having a necrosis:apoptosis ratio further than 1.5x this standard deviation from WT levels were deemed to demonstrate abnormal apoptosis rates.
Growth rate and drug sensitivity assays
Growth and drug sensitivity assays were performed both on solid media and in liquid cultures. For solid assays, the required drug concentration was added to YPD-agar containing 10μg/m/mL phloxine B. Overnight cultures of the strains were spotted onto the (drug-containing) plates using a Singer rotor, as above. Plates were incubated at 3°C and photographed at 24 and 48 hours and analysed using an image-processing code as described above. Strain growth and viability was compared both with WT growth on the same plate, and with growth on YPD-agar (or YPD-agar plus DMSO, where the drug is DMSO-soluble). The ratio of viability and size with and without drug was calculated for every strain on a plate, and the standard deviation of all ratios calculated. Strains having a drug:untreated ratio greater than or less than two standard deviations from that of the WT were deemed to be resistant and sensitive, respectively.
Assays in liquid culture were performed by transferring 5mL of overnight culture into each well of a 96-well microtitre plate, containing 200 μL of YPD plus the required concentration of drug. Absorbance was measured for 30 hours at 3°C using a BMG Optima platereader, maximum growth rate calculated using a curve-fitting script written in R, and the growth rate for each strain compared with that of the WT in the same plate, and growth in YPD/YPD + DMSO.
Nuorodos
Yi K, Ju Y. Patterns and mechanisms of structural variations in human cancer. Exp Mol Med. 201850:98.
Yang L, Luquette L, Gehlenborg N, Xi R, Haseley P, Hsieh C, Zhang C, Ren X, Protopopov A, Chin L, et al. Diverse mechanisms of somatic structural variations in human cancer genomes. Ląstelė. 2013153:919–29.
Zhang Y, Yang L, Kucherlapati M, Chen F, Hadjipanayis A, Pantazi A, Bristow C, Lee E, Mahadeshwar H, Tang J, et al. A pan-cancer compendium of genes deregulated by somatic genomic rearrangement across more than 1,400 cases. Cell Rep. 201824:515–27.
Campbell P, Getz G, Stuart J, Korbel J, Stein L. Pan-cancer analysis of whole genomes. Preprint at. 2017. https://doi.org/10.1101/162784.
Zhang Y, Chen F, Fonseca N, He Y, Fujita M, Nakagawa H, Zhang Z, Brazma A, Creighton C. Whole genome and RNA sequencing of 1,220 cancers reveals hundreds of genes deregulated by rearrangement of cis-regulatory elements. Preprint at. 2017. https://doi.org/10.1101/099861.
Deaton A, Bird A. CpG islands and the regulation of transcription. Genes Dev. 201125:1010–22.
Bird A. DNA methylation patterns and epigenetic memory. Genes Dev. 200216:6–21.
Pfeifer G. Defining driver DNA methylation changes in human cancer. Int J Mol Sci. 201819:E1166.
Morano A, Angrisano T, Russo G, Landi R, Pezone A, Bartollino S, Zuchegna C, Babbio F, Bonapace I, Allen B, et al. Targeted DNA methylation by homology-directed repair in mammalian cells. Transcription reshapes methylation on the repaired gene. Nucleic Acids Res. 201442:804–21.
Russo G, Landi R, Pezone A, Morano A, Zuchegna C, Romano A, Muller M, Gottesman M, Porcellini A, Avvedimento E. DNA damage and repair modify DNA methylation and chromatin domain of the targeted locus: mechanism of allele methylation polymorphism. Sci Rep. 20166:33222.
Allen B, Pezone A, Porcellini A, Muller M, Masternak M. Non-homologous end joining induced alterations in DNA methylation: a source of permanent epigenetic change. Oncotarget. 20178:40359–72.
Sun W, Bunn P, Jin C, Little P, Zhabotynsky V, Perou C, Hayes D, Chen M, Lin D. The association between copy number aberration, DNA methylation and gene expression in tumor samples. Nucleic Acids Res. 201846:3009–18.
Davis C, Ricketts C, Wang M, Yang L, Cherniack A, Shen H, Buhay C, Kang H, Kim S, Fahey C, et al. The somatic genomic landscape of chromophobe renal cell carcinoma. Cancer Cell. 201426:319–30.
Forbes S, Beare D, Boutselakis H, Bamford S, Bindal N, Tate J, Cole C, Ward S, Dawson E, Ponting L, et al. COSMIC: somatic cancer genetics at high-resolution. Nucleic Acids Res. 201745:D777–83.
Lawrence M, Stojanov P, Mermel C, Robinson J, Garraway L, Golub T, Meyerson M, Gabriel S, Lander E, Getz G. Discovery and saturation analysis of cancer genes across 21 tumour types. Gamta. 2014505:495–501.
Chen F, Zhang Y, Gibbons D, Deneen B, Kwiatkowski D, Ittmann M, Creighton C. Pan-cancer molecular classes transcending tumor lineage across 32 cancer types, multiple data platforms, and over 10,000 cases. Clin Cancer Res. 201824:2182–93.
Storey JD, Tibshirani R. Statistical significance for genomewide studies. Proc Natl Acad Sci U S A. 2003100:9440–5.
Hu X, Wang Q, Tang M, Barthel F, Amin S, Yoshihara K, Lang F, Martinez-Ledesma E, Lee S, Zheng S, Verhaak R. TumorFusions: an integrative resource for cancer-associated transcript fusions. Nucleic Acids Res. 201846:D1144–9.
Peifer M, Hertwig F, Roels F, Dreidax D, Gartlgruber M, Menon R, Krämer A, Roncaioli J, Sand F, Heuckmann J, et al. Telomerase activation by genomic rearrangements in high-risk neuroblastoma. Gamta. 2015526:700–4.
Creighton C, Hernandez-Herrera A, Jacobsen A, Levine D, Mankoo P, Schultz N, Du Y, Zhang Y, Larsson E, Sheridan R, et al. Integrated analyses of microRNAs demonstrate their widespread influence on gene expression in high-grade serous ovarian carcinoma. PLoS One. 20127:e34546.
Ungewiss C, Rizvi Z, Roybal J, Peng D, Gold K, Shin D, Creighton C, Gibbons D. The microRNA-200/Zeb1 axis regulates ECM-dependent β1-integrin/FAK signaling, cancer cell invasion and metastasis through CRKL. Sci Rep. 20166:18652.
Kiuru-Kuhlefelt S, Sarlomo-Rikala M, Larramendy M, Söderlund M, Hedman K, Miettinen M, Knuutila S. FGF4 and INT2 oncogenes are amplified and expressed in Kaposi’s sarcoma. Modas Patholas. 200013:433–7.
Weischenfeldt J, Dubash T, Drainas A, Mardin B, Chen Y, Stütz A, Waszak S, Bosco G, Halvorsen A, Raeder B, et al. Pan-cancer analysis of somatic copy-number alterations implicates IRS4 and IGF2 in enhancer hijacking. Natas Genetas. 201749:65–74.
Godinho M, Meijer D, Setyono-Han B, Dorssers L, van Agthoven T. Characterization of BCAR4, a novel oncogene causing endocrine resistance in human breast cancer cells. J Cell Physiol. 2011226:1741–9.
Kim J, Piao H, Kim B, Yao F, Han Z, Wang Y, Xiao Z, Siverly A, Lawhon S, Ton B, et al. Long noncoding RNA MALAT1 suppresses breast cancer metastasis. Natas Genetas. 201850:1705–15.
Yang X, Han H, De Carvalho D, Lay F, Jones P, Liang G. Gene body methylation can alter gene expression and is a therapeutic target in cancer. Cancer Cell. 201426:577–90.
Dixon J, Selvaraj S, Yue F, Kim A, Li Y, Shen Y, Hu M, Liu J, Ren B. Topological domains in mammalian genomes identified by analysis of chromatin interactions. Gamta. 2012485:376–80.
Andersson R, Gebhard C, Miguel-Escalada I, Hoof I, Bornholdt J, Boyd M, Chen Y, Zhao X, Schmidl C, Suzuki T, et al. An atlas of active enhancers across human cell types and tissues. Gamta. 2014507:455–61.
Taylor A, Shih J, Ha G, Gao G, Zhang X, Berger A, Schumacher S, Wang C, Hu H, Liu J, et al. Genomic and functional approaches to understanding cancer aneuploidy. Cancer Cell. 201833:676–89.
Knijnenburg T, Wang L, Zimmermann M, Chambwe N, Gao G, Cherniack A, Fan H, Shen H, Way G, Greene C, et al. Genomic and molecular landscape of DNA damage repair deficiency across The Cancer Genome Atlas. Cell Rep. 201823:239–54 1.
Bindea G, Mlecnik B, Tosolini M, Kirilovsky A, Waldner M, Obenauf A, Angell H, Fredriksen T, Lafontaine L, Berger A, et al. Spatiotemporal dynamics of intratumoral immune cells reveal the immune landscape in human cancer. Imunitetas. 201339:782–95.
Thorsson V, Gibbs D, Brown S, Wolf D, Bortone D, Ou Yang T, Porta-Pardo E, Gao G, Plaisier C, Eddy J, et al. The immune landscape of cancer. Imunitetas. 201848:812–30.
Mermel CH, Schumacher SE, Hill B, Meyerson ML, Beroukhim R, Getz G. GISTIC2.0 facilitates sensitive and confident localization of the targets of focal somatic copy-number alteration in human cancers. Genome Biol. 201112:R41.
Alaei-Mahabadi B, Bhadury J, Karlsson J, Nilsson J, Larsson E. Global analysis of somatic structural genomic alterations and their impact on gene expression in diverse human cancers. Proc Natl Acad Sci U S A. 2016113:13768–73.
Drier Y, Lawrence M, Carter S, Stewart C, Gabriel S, Lander E, Meyerson M, Beroukhim R, Getz G. Somatic rearrangements across cancer reveal classes of samples with distinct patterns of DNA breakage and rearrangement-induced hypermutability. Genome Res. 201323:228–35.
Esteller M. Epigenetics in cancer. N Engl J Med. 2008358:1148–59.
Eden A, Gaudet F, Waghmare A, Jaenisch R. Chromosomal instability and tumors promoted by DNA hypomethylation. Mokslas. 2003300:455.
Coarfa C, Pichot C, Jackson A, Tandon A, Amin V, Raghuraman S, Paithankar S, Lee A, McGuire S, Milosavljevic A. Analysis of interactions between the epigenome and structural mutability of the genome using Genboree Workbench tools. BMC Bioinformatika. 201415(Suppl 7):S2.
Hajkova P, Jeffries S, Lee C, Miller N, Jackson S, Surani M. Genome-wide reprogramming in the mouse germ line entails the base excision repair pathway. Mokslas. 2010329:78–82.
Laird P, Jaenisch R. DNA methylation and cancer. Hum Mol Genet. 19943 Spec No:1487–95.
James S, Pogribny I, Pogribna M, Miller B, Jernigan S, Melnyk S. Mechanisms of DNA damage, DNA hypomethylation, and tumor progression in the folate/methyl-deficient rat model of hepatocarcinogenesis. J Nutr. 2003133:3740S–7S.
Yung C, O'Connor B, Yakneen S, Zhang J, Ellrott K, Kleinheinz K, Miyoshi N, Raine K, Royo R, Saksena G, et al. Large-scale uniform analysis of cancer whole genomes in multiple computing environments. Preprint at. 2017. https://doi.org/10.1101/161638.
Wala J, Shapira O, Li Y, Craft D, Schumacher S, Imielinski M, Haber J, Roberts N, Yao X, Stewart C, et al. Selective and mechanistic sources of recurrent rearrangements across the cancer genome. Preprint at. 2017. https://doi.org/10.1101/187609.
Chen K, Wallis J, McLellan M, Larson D, Kalicki J, Pohl C, McGrath S, Wendl M, Zhang Q, Locke D, et al. BreakDancer: an algorithm for high-resolution mapping of genomic structural variation. Nat metodai. 20096:677–81.
Chen F, Zhang Y, Şenbabaoğlu Y, Ciriello G, Yang L, Reznik E, Shuch B, Micevic G, De Velasco G, Shinbrot E, et al. Multilevel genomics-based taxonomy of renal cell carcinoma. Cell Rep. 201614:2476–89.
Lee A, Ewing A, Ellrott K, Hu Y, Houlahan K, Bare J, Espiritu S, Huang V, Dang K, Chong Z, et al. Combining accurate tumor genome simulation with crowdsourcing to benchmark somatic structural variant detection. Genome Biol. 201819:188.
Fonseca N, Kahles A, Lehmann K-V, Calabrese C, Chateigner A, Davidson N, Demircioğlu D, He Y, Lamaze F, Li S, et al. Pan-cancer study of heterogeneous RNA aberrations. Preprint at. 2017. https://doi.org/10.1101/183889.
The_Cancer_Genome_Atlas_Research_Network. Comprehensive molecular characterization of clear cell renal cell carcinoma. Gamta. 2013499:43–9.
Johnson W, Rabinovic A, Li C. Adjusting batch effects in microarray expression data using empirical Bayes methods. Biostatistics. 20078:118–27.
Hoadley K, Yau C, Hinoue T, Wolf D, Lazar A, Drill E, Shen R, Taylor A, Cherniack A, Thorsson V, et al. Cell-of-origin patterns dominate the molecular classification of 10,000 tumors from 33 types of cancer. Ląstelė. 2018173:291–304.
McCarroll S, Kuruvilla F, Korn J, Cawley S, Nemesh J, Wysoker A, Shapero M, de Bakker P, Maller J, Kirby A, et al. Integrated detection and population genetic analysis of SNPs and copy number variation. Natas Genetas. 200840:1166–74.
Gerstung M, Jolly C, Leshchiner I, Dentro S, Rosado S, Rosebrock D, Mitchell T, Rubanova Y, Anur P, Yu K, et al. The evolutionary history of 2,658 cancers. Preprint at. 2018. https://doi.org/10.1101/161562.
Xie C, Leung Y, Chen A, Long D, Hoyo C, Ho S. Differential methylation values in differential methylation analysis. Bioinformatika. 201935:1094–7.
Creighton C, Nagaraja A, Hanash S, Matzuk M, Gunaratne P. A bioinformatics tool for linking gene expression profiling results with public databases of microRNA target predictions. RNR. 200814:2290–6.
Saldanha AJ. Java Treeview--extensible visualization of microarray data. Bioinformatika. 200420:3246–8.
Zhang Y, Yang L, Kucherlapati M, Chen F, Hadjipanayis A, Pantazi A, Bristow C, Lee E, Mahadeshwar H, Tang J, et al. R-code for linear models integrating expression data with somatic structural data. Github. 2019 https://github.com/chadcreighton/SV-expression_integration.
Metodai
Haploproficient genes and orthology analysis
The set of S.cerevisiae genes which are haploproficient in turbidostat culture was obtained using the growth data of [8] and an FDR cutoff of 0.02. This stringent FDR cut-off rigorously defines those genes for which heterozygosity confers a strong fitness advantage, but has no effect on the functional enrichment of genes identified as haploproficient. Genes defined as ‘haploproficient’ for the purposes of this study are listed in Additional file 1: Table S1. The set of chromosome maintenance-associated HP genes described in [8] overlaps, but is not coincident, with the HPGI set studied here, since the current set also includes DNA damage-response genes.
Orthology assignments were made using the InParanoid algorithm [50] and compared with the results of a BLAST [51] reciprocal best-hits search. GO enrichment searches were performed using the Babelomics 4 FatiGO tool [52]. To assess the significance of HP gene conservation, the number of HP genes having orthologs in a given Ascomycete species, given the number of S. cerevisiae HP genes, was compared against the whole-genome conserved proportion using a χ 2 or Fisher exact test (depending on sample size), with the null hypothesis of identical distribution. All findings of significance were reiterated using a Z test for difference of proportions. Where necessary, P values were corrected for multiple testing using the Bonferroni correction. Cell cycle and DNA damage repair pathways were obtained from the KEGG pathway database [53].
Expression data for S.cerevisae genes was obtained from the Saccharomyces Genome Database [54] and protein expression levels from [55]. A list of human cancer genes/oncogenes was obtained from the Cancer Gene Index [17] enrichment of HP genes amongst the orthologs was determined using a χ 2 test as above. CNV incidence across eight tumour types (breast invasive carcinoma, rectum adencarcinoma colon adenocarcinoma, kidney renal cell clear carcinoma, uterine corpus endometrioid carcinoma, glioblastoma multiforme, acute myeloid leukemia, lung adenocarcinoma, lung squamous cell carcinoma, serous cystadenocarcinoma) as measured by comparative genomic hybridisation, was obtained from the NCI Cancer Genome Atlas online data browser [17] with a copy number (log2 ratio) of magnitude Ϡ.5 taken as the significance threshold. Details of the sampling and analysis of the tumour samples are described in [17]. A P-value for HP ortholog overrepresentation was calculated using a χ 2 test .The TGCA database was also used to perform a pathway search for overrepresentation of HP orthologs.
Yeast strains
In total, 30 HP genes were chosen for analysis, based upon the criteria discussed in the Results above. The heterozygous deletion mutant of each gene was obtained from the heterozygous diploid deletion library (Open Biosystems), in the BY4743 (MATa/α, his3D1/his3D1, leu2D0/leu2D0, LYS2/lys2D0, met15D0/MET15, ura3D0/ura3D0) genetic background. For non-essential genes, the homozygous deletant was retrieved from the analogous homozygous diploid deletion library (Open Biosystems).
Control strains were the BY4743 WT, along with the heterozygous deletion mutant of the non-functional his3 locus the non-HP, non-cell cycle ho/HO heterozygous deletion strain and the heterozygous deletion mutant of the non-HP, cell cycle gene HSL1. In addition, heterozygous deletion mutants of the G1 and G2 cyclins were included in several of the experiments. A complete list of the strains used is provided in Additional file 6: Table S6.
Cell-cycle profiling
Flow cytometric analysis of the deletion strains’ cell cycle profiles was carried about following the method of [56]. Trumpai,
10 7 cells in mid-exponential phase were harvested, washed, and fixed in absolute ethanol at 4C overnight. Fixed cells were then collected, washed, and boiled for 15 minutes in 2 mg/mL RNAse in 50 mM Tris-Cl (pH 8), and incubated at 37C for 2 hours. Cells were resuspended in protease solution (5 mg/mL pepsin, 4.5 μL/mL concentrated HCl), incubated for 15 minutes at 37C and resuspended in 50 mM Tris (pH 7.5). For analysis, 50 mL of cell suspension was added to 1 mL of 1 mM Sytox Green in 50 mM Tris pH 7.5), vortexed and analysed using a Cyan flow cytometer (Beckman Coulter). FlowJo (Tree Star) analysis software was used to fit histograms to the peaks representing 1C and 2C DNA content, and thereby calculate the number of cells in the G1 and G2 phases, and infer the number in S phase from the remaining fraction of the population.
Chronological lifespan assay
Cultures were inoculated from frozen stocks, grown overnight in YPD at 3ଌ, and 200mL of each was transferred into a well of a 96-well microtiter plate (Corning). Strains were present in duplicate on each plate, with a buffer of WT in the wells around the edge of the plate, so edge effects would not impact test colony measurements. A Singer Rotor HDA colony pinning robot was used to spot four replicates of each well onto a YPD + μg/mL phloxine B (Sigma) plate. Phloxine B is a fluorescein derivative taken up when the cell membrane is disrupted upon cell death [57]. Plates were incubated for 48 hours at 3ଌ and photographed using an Epson 1240 Scanner. The colony images were analysed using a custom image-analysis code written in MatLab, with colony size measured by pixel count, and fraction of dead cells by the intensity of colony redness [10]. Since these parameters are independent, this allowed the dissection of the effect of cell viability upon colony growth from that of growth rate variation. The 96-well liquid cultures were incubated at 3ଌ, and, every second day over a period of three weeks, the colony-pinning onto YPD + phloxine B and image analysis repeated. For each plate, the median culture intensity for each strain was compared with the growth of the WT on that plate, and also with the strain growth and viability after the initial 48-hour period. The experiment was performed twice.
At several points throughout the 3-week period, several strains were selected at random, and viability assayed by performing serial dilutions and counting colony-forming units. These results were checked for compatibility with the microplate viability results.
Apoptosis assays
The rate of occurrence of apoptosis in the different strain populations was measured in two ways. Apoptosis was first induced by pretreating cells with 0.001%, 0.01% MMS, 0.0001% or 0.001% TBHP in overnight culture keeping a negative, non-induced WT control sample.
The translocation of phosphatidyl serine to the cell surface, a marker of apoptosis [58], was measured using an Annexin V-FITC Apoptosis Detection kit. (Sigma). Cells were harvested, washed in 1.2M sorbitol, 0.5 mM MgCl2, 35 mM K phosphate (pH 6.8) and then digested in 5.5% glusulase (Sigma) and 15 U/mL lyticase (Sigma) for 2 hours at 28C. Spheroplasts were harvested, washed in binding buffer (10 mM Hepes/NaOH pH 7.4, 140 mM NaCl, 2.5 mM CaCl2 in 1.2 M sorbitol buffer) and resuspended in binding buffer/sorbitol. 5 mL of FITC-labelled annexin V, and 10 mL of 10010 mg/mL propidium iodide were added to each sample, with control samples containing 1.) no label, 2.) FITC-annexin V only, and 3.) PI only. Fluorescence was quantified using a CyAn (Beckman Coulter). Gates were fitted on the basis of the the control samples, dividing a log PI versus log FITC plot into four quadrants: lower left (neither FITC nor PI-stained) – viable cells upper left (PI stain only) – necrotic cells lower right (FITC only) – early apoptotic cells and upper right (PI and FITC-stained) – late apoptotic cells. FlowJo software (TreeStar) was used to count the fraction of the total cell population in each quadrant. The proportion of both necrotic and apoptotic cells for each strain was normalised to strain viability (i.e. on the basis of the proportion of cells assigned to the lower-left FITC/PI quadrant), and the ratio of necrotic:apoptotic cells calculated. Ratios for each strain were normalised to the WT value, and the standard deviation across all samples calculated. Strains having a necrosis:apoptosis ratio further than 1.5x this standard deviation from WT levels were deemed to demonstrate abnormal apoptosis rates.
Growth rate and drug sensitivity assays
Growth and drug sensitivity assays were performed both on solid media and in liquid cultures. For solid assays, the required drug concentration was added to YPD-agar containing 10μg/m/mL phloxine B. Overnight cultures of the strains were spotted onto the (drug-containing) plates using a Singer rotor, as above. Plates were incubated at 3ଌ and photographed at 24 and 48 hours and analysed using an image-processing code as described above. Strain growth and viability was compared both with WT growth on the same plate, and with growth on YPD-agar (or YPD-agar plus DMSO, where the drug is DMSO-soluble). The ratio of viability and size with and without drug was calculated for every strain on a plate, and the standard deviation of all ratios calculated. Strains having a drug:untreated ratio greater than or less than two standard deviations from that of the WT were deemed to be resistant and sensitive, respectively.
Assays in liquid culture were performed by transferring 5mL of overnight culture into each well of a 96-well microtitre plate, containing 200 μL of YPD plus the required concentration of drug. Absorbance was measured for 30 hours at 3ଌ using a BMG Optima platereader, maximum growth rate calculated using a curve-fitting script written in R, and the growth rate for each strain compared with that of the WT in the same plate, and growth in YPD/YPD +𠂝MSO.
2. Metodai
This section proposes an expanded graph database model that includes the gene expression, miRNA expression, DNA methylation, copy number gain and loss information, tissue slide information, and mutation data from TCGA. It also outlines the steps performed to create the proposed graph database model.
2.1. Duomenys
For this study, we have specifically added copy number information, miRNA expression, and image information of the tissue slide to the previously stored clinical information, gene expression (log2 counts per million), hyper and hypomethylation information, and mis-sense mutation data from the Genomics Data Commons (GDC) for breast cancer (BRCA), prostate adenocarcinoma (PRAD), and the pancreatic adenocarcinoma (PAAD). Table 1 shows the summary information about the data set used for this study.