TCGA癌症临床数据能源全面介绍---癌症研究领域的全谱!

2022-01-17 11:26 来源:宿迁妇科医院

2006年,结核得病序列示意图集(The Cancer Genome Atlas, TCGA)原先以多形开放性胶质母蛋白刺毛(GBM)、肺结节蛋白癌(LUSC)和卵母蛋白氯化钙开放性囊脑瘤(OV)开始为期3年的试点重大项目,2009年~2015年年初展开。到重大项目日和,TCGA网络研究成果从业人员已描绘了33种结核得病子类10,000余则有得哮喘的分子结构特点,并假定了很多分子结构非典型。TCGA组合而成的治疗决定性特点代所列人另行潮流化的原始数据给予。为确保正确用到这些具序列特点的海量治疗原始数据,早先TCGA完成一批重大成果,发所列在CellPress集团的学术刊物。

本文对4同年5日发所列Cell上的一文同步进行编译。文章阐述以OS(总求生期)、PFI(无成效间隔)、DFI(无得病间隔)和DSS(疾得病相关存活)为四个主要治疗结果西端的TCGA另行潮流结核得病治疗原始数据教育资源(TCGA-CDR)规范化原始目录,并给造出了每种结核得病子类的西端用到劝告。TCGA治疗原始数据可从序列原始数据共享空间(GDC)门户网站下载,所有的分子结构原始数据在下载。治疗原始数据和分子结构原始数据用到同样的条码结构,便于得哮喘的治疗资料和抽取分子结构原始数据定位。

TCGA另行潮流癌原始目录所列头特点

示意图1A为治疗原始数据定位和人口统计基本原理及4个主要治疗西端相异和审核的流程示意图,对33份初始登记和97份后续原始数据文件,共33种结核得病子类111,60则有结核得病得哮喘的资料同步进行了处理。所列1为每个TCGA所列头的基本特点。按原发抽取根据分子结构特点崭露头角每个所列头,皮肤黑色素刺毛(SKCM)的原发和转回炊两种子类都有,其它极少数的原发与转回子类也有研究成果。

示意图1. 治疗原始数据定位和人口统计基本原理及4个主要治疗西端相异和审核流程示意图

所列1. TCGA 另行潮流癌所列头特点

治疗结果西端OS、PFI、DFI和DSS

总求生期(OS)很最主要,灵活性是假定OS重大事件时模糊开放性上限。但用到OS作西端可能丧失治疗研究成果,因为非癌杀因不见得能反映造出遗传学、波及开放性或对放射治疗消除。用到OS或需非常长的随访时间段;很多治疗试验中都,通常选用比较随访时间段较短的DFI或PFI。针对现有TCGA治疗原始数据,要认识到比如说治疗随访间隔在波及开放性结核得病子类结果的最主要开放性,因为可能几年内就通过观察到治疗重大事件,在杀亡此前已用到得中风住院或成效。对波及开放性较弱的结核得病子类,得哮喘在数十乃至几十年后住院,随访之此前可能无法通过观察足够重大事件以拥护可靠结果供正确。该人口统计分析的目的是检查TCGA另行潮流癌治疗检测的比较优势和不足,指导现阶段的人口统计分析和避免随访时长不足等缺陷。

人口统计分析全部TCGA治疗原始数据后,论据如下:在原始数据可给予时,OS、PFI及DFI比较精确,但多数情况下只能少于DSS。示意图1B为33种相同结核得病子类的OS K-M切线。尽管求生人口统计分析不是TCGA主要目的,多数结核得病子类求生切线与过去审核相同求生西端的独立研究成果基本相同,GBM、OV(2008, 2011)和低级别胶质刺毛(LGG)(2015)的TCGA结果就是比较好则有证。PFI、DFI和DSS的K-M切线见示意图1C–1E。

示意图1 B-E治疗原始数据人口统计分析

基于每种结核得病子类4个西端的通过观察时间段计算平均随访时间段及重大事件或检查的中都位时间段(所列2)。所有的中都位随访时间段为22.1个同年,但相同子类结核得病该时间段区别极大;GBM和急开放性髓系白血得病(LAML)最短有约12个同年,而肾嫌色蛋白癌(KICH)最长有约48个同年。

所列2 总体中都位随访时间段及4个西端的重大事件与通过观察中都位时间段

举荐用到的治疗结果西端

治疗结果西端极为只能取决于研究成果目的、重大事件数量、所列头大小和结果原始数据低质量。将这些步骤和开发的其它步骤作为对单个疾得病原始目录的试验中和可用检查,给造出在每种疾得病子类中都用到每个结果西端的劝告及原因(所列3)。每种结核得病子类的求生西端只能多于通过一个主要试验中和可用检查才被接受。33种癌中都的13种用到全部4个西端:膀胱尿路上皮癌(BLCA)、乳头状结节蛋白癌(CESC)、结肠癌(COAD)、食管癌(ESCA)、躯干结节蛋白癌(HNSC)、肾状蛋白癌(KIRP)、肺脑瘤(LUAD)、LUSC、OV、胰脑瘤(PAAD)、肉刺毛(SARC)、小肠脑瘤(STAD)和输卵管内膜癌(UCEC)。相反,无法一个西端的有嗜铬蛋白刺毛和副神经节刺毛(PCPG)。淋巴汹涌大B蛋白淋巴刺毛(DLBC)、LAML和颈腺刺毛(THYM)仅仅一个西端;一小结核得病子类2或3个西端,但其中都一些持保留见解。最可靠的是PFI,可无保留地举荐给除LAML(无原始数据)、DLBC和KICH(小心谨慎用到)和PCPG(不举荐)除此以外的4种。

所列3 西端OS,PFI,DFI及DSS的审核与举荐用到

实验者TCGA-CDR及个案运用

在乳脑瘤研究成果中都,雄激素ER阴开放性得哮喘治疗求生期得病症比ER+得哮喘差。分别用OS、PFI、DFI和DSS比较这两类得哮喘的求生期(示意图3A–3D;切线日和于10年随访时间段,但用到整个原始目录同步进行人口统计分析)。单状况人口统计分析看出,用到PFI(p= 0.005)和DFI(p = 0.001)作为治疗西端,TCGA中都ER+乳脑瘤得哮喘比ER-得哮喘有非常好的求生期,但用到OS时两类得哮喘间不不存在区别(p = 0.097) 。此除此以外,两类得哮喘的DSS(p = 0.009)有显着区别,所列明DSS的潜在实用价值。以上发现所列明了PFI和DFI是特定子类乳脑瘤分子结构研究成果的合适西端。

示意图3 实验者和运用实则有

此除此以外还实验者了波及开放性GBM求生结果西端。TCGA中都GBM中都位OS为12.6个同年,介于早先报道的规范放射治疗的12.1个同年和规范放射治疗协同替莫唑胺的14.6个同年间。中都位PFI是6.1个同年,介于早先报道的规范放射治疗5个同年和规范放射治疗协同替莫唑胺的6.9个同年间。也许,TCGA原始目录OS和PFI重大事件时间段与文献一致。再次印证OS和PFI作为GBM分子结构研究成果的治疗西端效度。

用Cox比则有可能会重生基本概念断定高期(III、IV期)比较低期(I、II期)结核得病得哮喘的可能会比(HR),实验者4个西端的TCGA-CDR原始数据。由于DFI假定与其它结果的假定不一致,对举荐用到OS、PFI和DSS的14种子类结核得病比较logHR(所列3)。随后仅仅对满足Cox比则有可能会假定的疾得病同步进行人口统计(示意图3E–3G)。结果所列明,14种子类结核得病中都,除间皮刺毛(MESO)、PAAD和葡萄膜黑色素刺毛(UVM)除此以外,高期对比低期HR在3个举荐西端OS、PFI及DSS上明显偏高。选用以此类推抽取的Wilcoxon秩和检验,当用到PFI与DSS(p = 0.0008)或PFI与OS(p = 0.039)精确测量时,logHR有显着区别,看出疾得病成效和求生西端在HR上不存在系统也就是说;OS与DSS间无法显着区别(p = 0.106)。对2个logHR值的规范大意同步进行伪基准断定Pearson正态分布, 由logHR少于的3种结果有极显着正相关:PFI和OS正态分布0.96(95%概百余人分布[CI]:0.77–0.99),PFI和DSS为 0.95(95%概百余人分布:0.76–0.99),OS和DSS为0.90(95%概百余人分布:0.61–0.98)。这些相关开放性潜在拥护治疗早期用PFI,晚期用OS和DSS好好西端。

除了定位分子结构原始数据,还尝试人口统计分析首次放射治疗后无得病得哮喘与非无得病得哮喘有否用到相同的另行重大事件。TCGA-CDR中都29类结核得病反馈用好好妥善解决该疑问,纳入得哮喘从治疗到完成首治并达到无得病状态多于存活3个同年。以LUSC为则有,有289则有无得病得哮喘和41则有曾一度非无得病得哮喘,NTE百余人分别为21.8%和68.2%。用Cox比则有可能会重生基本概念,发现在非无得病得哮喘中都NTE可能会显着高于无得病得哮喘(HR = 6.68,95% CI = 4.25–10.51,FDR变动q值<0.05)。在另除此以外21种结核得病子类中都也有类似于结果(所列4)。余下7种中都无法通过观察到这些区别。我们也在审核有否每个基本概念都满足比则有可能会假定,其中都有两个不符合,只能研究成果时间段倚赖及多给定基本概念来寻找原因。

所列4 非无得病与无得病得哮喘NTE发展对比

TCGA从亚太地区数百个接入给予得病则有,为妥善解决治疗原始数据相同接入间的可比开放性,需慎重考虑原始数据完整开放性、和得哮喘特点等。对每种疾得病而言,我们对比了此前两名提供得病则有数最多的组织来源接入(TSS)与所有其它TSS的同种疾得病及4个结果西端(所列5)。

所列5 对来自此前两位TSS的每个结核得病子类研究成果结果同步进行比较

对于GBM等更具波及开放性的,此前两位TSS(#1和#2)的发得病这群人与其它TSS远比类似于的有OS、PFI和DSS,因重大事件实在少难以人口统计分析不举荐DFI好好西端。BRCA等较低波及开放性,顺势举荐用到PFI和DFI,但劝告小心谨慎用OS或DSS审核。TSS #1的治疗原始数据导致不实在好的OS和DSS,但无法通过观察到PFI区别;另除此以外,所列面上TSS#1有非常好的DFI结果,仅仅用到3则有 DFI重大事件。这种所列里不一的现象所列明该接入的结果原始数据需进一步审核。另一层面,TSS #2的4个西端结果与其它大都一致。

这个最简单的结果比较所列明,当从特定结果人口统计分析整体而言TCGA的治疗原始数据时,只能慎重考虑TSS的具体反馈。由于年龄、分期/分级及放射治疗等状况影响相同TSS患得病这群人的西端结果,TSS可以作为这些和不完全治疗脚注等其它未曾精确测量区别的替代。

潜在的比如说状况、竞争结果的

可能会及基本概念假定

对治疗求生西端人口统计分析来说,劝告用到所处理的全部治疗原始数据。但远比分子结构/序列原始数据的定位人口统计分析,要注意两个层面。首先,举荐见解基于基线求生基本概念,以分子结构非典型作分析因子区分抽取集,有可能破坏结果人口统计的显着开放性区别。因此,从互相关联的TCGA分子结构原始数据或非典型TCGA-CDR结果原始数据中都得造出的论据需在独立的原始目录中都进一步所列明。

第二,我们劝告仅仅用到原发的分子结构原始数据,因为得哮喘初诊时,最主要时间段反馈等归一化的治疗原始数据已给予比较完整。皮肤黑色素刺毛(SKCM)在TCGA子类中都非常特殊,470则有中都仅仅103则有原发,其余296则有为原发局部淋巴结转回,68则有远端转回。这与极少给予到转回刺毛的其它TCGA结核得病子类演化成;也。SKCM转回刺毛极少具归一化的原发,而其它TCGA结核得病子类尽管极少有转回刺毛,但都具归一化的原发抽取。因此,对于SKCM结果的相关开放性,劝告只用到有限数量的原发得病则有,尽管SCKM淋巴结转回的III期得病则有可作为独立组群同步进行研究成果。

在用到另行定位的TCGA-CDR原始目录时,还只能注意:潜在混淆状况、竞争结果的可能会及基本概念假定。

比如说状况

比如说状况不存在但被排除在基本概念之除此以外时,也就是说可能高估或低估真实。如在乳脑瘤的种族区别研究成果中都,非裔与有色人种得哮喘间不存在最主要的基因所列达区别,然而根据分子结构非典型同步进行变动后,这种区别显着减少甚至消失。治果也是潜在的比如说状况,当反馈可给予时应适当慎重考虑变动。放射治疗未曾知时,年龄、诊治医务人员及治疗年份等规范放射治疗作为替代反馈能减少大部分差值。对这层面的决策建模,努力用到标志物得病症研究成果劝告报告(REMARK)。

竞争结果的可能会

测量DSS、DFI和PFI西端时,要对无法经历最主要重大事件且无得病的杀亡得哮喘同步进行审查。在这种情况下,如果假定得哮喘无法其它杀因,那她/他再度仍可能杀于结核得病指征。然而,在少于放射治疗等分析因子对继发开放性结核得病或心血管疾得病等非指数结核得病杀亡可能会的分析能力时,该假定极为可取。

基本概念假定

运用Cox比则有可能会(PH)基本概念须要检查PH假定。除少数个案除此以外,大多数基本概念都满足Cox PH假定,但需进一步探索这些个案以找造出违背假定的原因,从而对HR好好造出非常吻合的少于。尽管现在为清扫原始数据和妥善解决疑问付造出了巨大努力,但仍不存在最主要的用到上限,访问TCGA治疗原始数据都须要了解这些上限。

首先,TCGA主要是为分子结构研究成果内部设计,早先得病则有极为只能来自多个私人机构具合适库存组织的未曾放射治疗原发得病则有,因此这些得病则有不组合而成连续开放性。此除此以外,对于每种相同子类/研究成果,随访原始数据无法标准化给予。同时,治疗原始数据给予的一些规则在过去不得不随着时间段的演进而忽略。TCGA - CDR不组合而成结核得病放射治疗史,并非所有得病则有都被脚注。因此,人口统计分析特定子类或非典型的放射治疗取材胜过概况开放性另行潮流癌人口统计分析。当得哮喘同步进行具体放射治疗时,受益要用DFI和PFI西端有效率人口统计分析。

其次,TCGA抽取治疗随访根据当地托儿所的时间段所列,可能为疾得病或特定部位的住院和得病人最主要生命状态的就有,因此无法TCGA指定的治疗随访原先,仅仅给造出重大项目主要强调的分子结构特点。

终于,几乎所有TCGA给予的抽取和序列及分子结构原始数据来自另行诊得哮喘原发的单个切片,由此导致的序列和分子结构原始数据只能在空间或时间段任何层面明确捕获代所列人另一得哮喘结果给定的异质开放性。该疑问不是TCGA独有的,任何静态原发开放性研究成果都不存在。

展望

这项临时工是有史以来第一次年初系统地处理TCGA另行潮流癌治疗资料。由此导致的TCGA-CDR的结果西端与独立非TCGA研究成果结果一致,说明该教育资源在此前所未见数量的治疗尺度上提供了生物观测另行视角。也要认识到TCGA-CDR的内在用到局限开放性及决定性开放性指导和举荐见解。现在非常模棱两可,本能疾得病将来大数量的分子结构研究成果须要系统地给予治疗得病理、放射治疗和转归重大事件原始数据,以尽力最高规范的治疗研究成果。尽管有其局限开放性,TCGA-CDR提供了规范化原始目录,以及清晰的4个治疗结果西端导造出,并妥善解决了低质量疑问,从而在另行潮流癌和个体技术水平上同步进行转变成研究成果。将来原始数据研究成果的融合将提高结果间的可比开放性,非常好地解释和拥护减法。

摘要

An Integrated TCGA Pan-Cancer Clinical Data Resource to Drive High-Quality Survival Outcome Analytics

TAG:
延伸阅读
院长段涛:医生和幼儿园孩子一样 是残忍的犯罪行为
七月涓,八月飞雪(飞血)今年的八月是个让人悲哀、深沉和无奈的初夏,特别未详,医疗卫生队被的事件真相一波接着一波的再次次发生,好像没有人...[详细]
2022-05-10
慢性附件炎有什么症状展现呢
慢性附件炎是附件炎的类似于类别,不一定是急性附件炎为及时压制和治疗,进而其发展而来,具备呕吐不值得注意,炎症深,久治不愈,一再头痛的优...[详细]
2022-05-05
卸货前的几个征兆,别等熊猫发动了才知道!
临产此前的预示• 呼吸困难缓解很多准妈妈在产后后期时会经常无法忍受呼吸吃力。而在早产入盆后,准妈妈出现宫低上升,之此前早产对动脉的压制时...[详细]
2022-05-04
附件炎什么病征 患者会有哪些表现
对于大多数的前男友来说,附件炎是一种非有时候见的一种传染病。有很多前男友不了解这种传染病的病征,很较难就时会延误到化疗的最佳时期。那么...[详细]
2022-05-03
月经不调的危害 这个问题竟会引起肾上腺紊乱
月经不调是很多的熟人都共存的一个疑问,似乎时时明白这只是可能会产生痛经而已,似乎它的危害是相当大的。月经不调的背后是有很多可能的,如果...[详细]
2022-05-02
例假量少的可能 这些可能导致月经量变少(2)
元月量不及吃什么好 元月量不及的异性恋不宜多吃含锰量丰良和解毒真实感很好的肉类,如牛奶、鸡蛋黄、豆浆、菠菜、乌骨鸡、火锅、峨眉、动物肉...[详细]
2022-05-02
月经不调怎么办 这么做能治疗法月经不调
很多异性恋在受孕期间,都都会特别注意到受孕不调的上述情况,有的时候都会提早很多,有的时候都会原订很久。受孕不调怎么办?受孕不调是什么缘故...[详细]
2022-04-28
重视女童生殖健康,从预防措施保健开始!
国外早在几十年前开始成立的国际病药理学联盟(FIGIJ),专门从事针对病、身为人药理学性疾病的传染病诊治,2017年复旦大学药理学院自建医疗中会心...[详细]
2022-04-27
@所有人 特地对村医好一点
乡村医师是一种崇高的职业。在乡村,有人叫他们医师,也有人指为他们谭。不管是医师还是谭,这样的指为呼足以让村医满足一辈子,这是村民对村医...[详细]
2022-04-26
  • 地区医院
  • 医院联盟