恶性实体瘤组织不仅包括肿瘤细胞,还包括与肿瘤相关的正常上皮和基质细胞,免疫细胞和血管细胞。基质细胞被认为在肿瘤生长、疾病进展和耐药性中起重要作用。
浸润性免疫细胞的作用与环境有关,虽然浸润性T淋巴细胞的抗肿瘤作用在卵巢癌中已被观察到,但在结直肠癌中,肿瘤的生长、侵袭和转移与肿瘤的生长、侵袭和转移有关.
对肿瘤组织中与肿瘤相关的正常细胞的全面了解可能为肿瘤生物学的研究提供重要的见解,并有助于开发可靠的预后和预测模型。
作者提出了一种新的算法,利用癌症样本转录谱的独特性质来推断肿瘤细胞的内容以及不同的浸润正常细胞,称为Estimation of STromal and Immune cells in MAlignant Tumour tissues using Expression data(ESTIMATE)。
作者重点研究基质细胞和免疫细胞,它们构成了肿瘤样本中主要的非肿瘤成分,并识别与肿瘤组织中基质细胞和免疫细胞浸润相关的特异性信号。通过进行单样本基因集富集分析(ssGSEA),作者通过计算基质和免疫评分来预测浸润基质和免疫细胞的水平,这些构成了在肿瘤组织中推断肿瘤纯度的 ESTIMATE score的基础。
An independent poor-prognosis subtype of breast cancer defined by a distinct tumor immune microenvironment
一种由独特的肿瘤免疫微环境定义的独立贫血亚型乳腺癌
发表期刊:Nat Commun
发表日期:2019 Dec 3
影响因子:12.121
DOI: 10.1038/s41467-019-13329-5
一、研究背景
肿瘤微环境影响癌症的起始和进展。在乳腺癌中,临床病理特征,如年龄,等级,阶段和分子亚型与预后有关,并驱动治疗决策。5种临床相关的分子亚型:Luminal A、Luminal B、Her2富集型、基底样型和正常样型,其发病率、生存率、预后和肿瘤生物学特性各不相同。
除了癌细胞生物学因素外,炎症微环境也影响着肿瘤的起始和进展。癌细胞周围的免疫微环境可以识别和抑制肿瘤生长或促进进展。在乳腺癌中,高免疫浸润已与更好的临床结果。此外,高免疫浸润已与新辅助和辅助化疗的反应增加相关。
二、材料与方法
1 数据来源
1)基因表达:手术收集的MicMa队列(其中的子集用于分析, MicMa-nCounter(n = 96,FFPE),MicMa-Agilent(n=104,新鲜冷冻组织))
2)RNA-seq:OSLO2-EMIT0队列(GSE135298,原始数据在EGAS00001003631)
3)公开的数据:表达数据从GEO、European Genome-phenome Archive、ArrayExpress或TCGA获得;METABRIC队列
2 分析流程
1)基因集富集分析
2)无监督聚类获得免疫簇:基于509个基因,使用R包pheatmap对患者的相关性矩阵进行层次聚类
3)Nanodissect:用于淋巴和髓细胞浸润的预测,淋巴细胞或骨髓细胞浸润的nanodissect分数反映了样本中各自基因的平均表达量
4)CIBERSORT(22种类型的浸润性免疫细胞的绝对比例)、ssGSEA(上皮间质转化、干细胞、增殖和细胞周期相关途径的基因集)
5)二项式逻辑回归预测免疫集群:R包glmnet (构建模型公式)
6)免疫浸润的病理评估
7)ROR评分:ROR-Score=0.05×Basal+0.12×Her2-enriched − 0.34×Luminal A+0.23×Luminal B;其中,基底、Her2富集、管腔A和管腔B是每个样本与R中使用genefu软件包获得的质心的相关性
8)统计学、生存分析、多变量Cox回归分析
三、结果展示
01 - 乳腺癌的免疫簇并反映了逐渐的免疫浸润
测量了MicMa队列的95个肿瘤样本中760个基因的表达,该阵列旨在剖析实体肿瘤中的免疫浸润。这95个样本中的79个样本之前已经通过Agilent全基因组4×44K寡核阵列进行了剖析。首先使用Pearson和Spearman相关性比较了两个平台获得的表达,发现基因的表达值之间存在高度的正相关(补充图1A)。
为了根据免疫相关基因表达的相似性对患者进行分组,对相关矩阵进行了无监督的分层聚类(图1a和补充图1B)。从3到10个聚类的轮廓图分析表明,3个聚类最好地捕获了nCounter和Agilent数据集的分割(补充图1C,D)。比较了两个数据集MicMa-nCounter和MicMa-Agilent的聚类结果。在这两个数据集中,有79个样本是重叠的。随着用于测量基因表达的不同平台,以及基因列表和用于执行无监督聚类的样本的不完全重叠,仍然发现79个重叠样本的聚类分配显著相似。
为了确认集群与肿瘤免疫微环境相关(图1b),使用算法Nanodissect为总淋巴细胞和骨髓细胞浸润打分。Nanodissect评分首先在MicMa队列中使用有经验的病理学家分析的匹配苏木精和曙红切片的免疫浸润评估进行验证(图1c和补充图1E)。发现这三个簇与Nanodissect淋巴细胞(图1b)和骨髓细胞(补充图1F)评分显著相关。得出结论,簇A-C反映了逐渐的免疫浸润,因此被称为免疫簇。
使用其他9个队列的表达数据验证了这些簇与淋巴/髓细胞浸润之间的关联。有509个基因在所有研究的数据集中被发现,被用于无监督聚类(图1d和补充图2A,分别用于METABRIC和TCGA队列的聚类)。在每个队列中,所得到的三个聚类与淋巴和骨髓Nanodissect评分显著相关(图1e;补充图2B)。淋巴和髓细胞浸润从簇A(蓝色;低浸润;冷肿瘤)逐渐增加到簇B(浅蓝色;中等浸润)和簇C(粉红色;高浸润;热肿瘤)。
对于额外的一层验证,使用METABRIC队列中免疫浸润的病理评估,这与Nanodissect评分(图1f和补充图2C)和免疫簇显著相关。使用PanCancer免疫剖析阵列的基因进行无监督分层聚类,可以根据免疫浸润的渐进水平对乳腺癌肿瘤进行分组。
02 - 免疫簇与预后相关
对于两个最大的队列METABRIC(n = 1904)和TCGA(n = 981),发现簇B(具有中等水平的免疫浸润)与更差的预后相关(补充图3A,B)。当分别对ER阴性(补充图3C,D)和ER阳性(补充图3E,F)的病例进行分层时,也观察到簇B病例的这种更差的结果。为了完善观察结果,根据簇B(浅蓝色)与簇A和簇C(紫色)绘制了患者生存期图,并证实簇B患者的预后明显且显著恶化(图2)。用相关生存数据在另外四个队列中进一步验证了这一结果。结论是免疫簇与ER阴性和ER阳性乳腺癌的预后相关。
03 - 用二项式逻辑回归预测免疫簇
基于免疫聚类的临床相关性,旨在开发一种通用的方法,能够准确而敏感地预测患者的预后较差的分类,而不必依赖于无监督聚类。作者使用二项式逻辑回归,通过lasso进行惩罚,得到一组基因,这些基因可以敏感和特异地预测一个样本是否属于簇B,通过接收者操作特征曲线和曲线下面积(AUC)分析评估(图3a)。96.3%的样本被模型预测为簇A和簇C,而68.8%的样本分到了簇B(图3b)。
通过比较生存期对数秩检验p值,发现lasso分类普遍改善了免疫簇与生存期之间的显著关联。lasso模型在另外5个队列中得到了验证。图3c-e为STAM(n = 856)、MAINZ(n= 200)和UPSA(n = 289),补充图5A、B为CAL(n = 118)和PNC(n= 92)。
由于二项式逻辑回归只预测了两个簇(簇B与簇A和簇C),进行了另一轮二项式逻辑回归,以高准确度区分簇A和簇C(补充图5C,D)。
04 - 免疫簇,一个独立的预后因素
作者进一步研究了免疫簇与乳腺癌中著名的临床病理特征(大小、年龄、等级、阶段、淋巴结受累和分子亚型(PAM50))的关系。簇A(免疫浸润度低)富含ER阳性和Luminal病例,而簇C(免疫浸润度高)中ER阴性和Basal样病例比例较高,ER阴性和ER阳性样本以及PAM50亚型在预后不良的簇B中同样占有一定比例(图4a,b)。
使用多变量Cox回归分析测试了免疫簇的预后影响,同时考虑了其他预后因素。发现免疫簇是模型生存的重要因素,如每个队列Cox模型中与免疫群相关的显著p值所示。为了进一步检验免疫簇作为重要的预后生物标志物的优势,采用了逐步回溯选择的方法。对于所有队列,免疫簇被保留在最佳拟合的最小模型中,在11个队列中的9个队列中,免疫簇是一个显著的预后变量。
05 - 具有复发风险(ROR)评分的新RNA-seq数据集的验证
EMIT0,这是OSLO2队列研究的一个子集,OSLO2-EMIT0由食品和药物管理局批准的Prosigna复发风险(ROR)分数评估,ROR评分在标准的临床病理特征之上增加了重要的预后信息。发现簇B组成的样本与簇A和C相比具有中间的ROR评分(图4c),表明与簇B相关的不良预后不可能由ROR评分中包含的信息来解释。当分别评估ER阴性(补充图7A)和ER阳性(补充图7B)病例时有同样结果。对于所有队列通过已有方法计算ROR评分,该方法与PAM50亚型有关,并证实簇B由中间ROR评分组成(图4d和补充图7C,D)。
多变量回归分析证实,免疫簇为ROR评分带来了额外的预后价值,这体现在用ROR评分和免疫簇建立生存模型时,免疫簇的p值显著。通过计算净重分类改善(NRI)和综合判别改善(IDI)指数,强调了免疫簇与ROR评分一起使用时,根据生存率对患者进行分类的额外价值,正如所有队列中NRI和IDI系数为正值所示。NRI和IDI的置信区间(CI)构建的Bootstrapping显示,对于几个队列,免疫簇与ROR评分相加时,显著改善了患者根据预后的分类。
06 - 免疫簇和对新辅助化疗的反应
进一步评估了免疫簇与新辅助化疗反应之间的关系,使用了来自8项研究(1377个样本)的基因表达数据,并使用lasso将每个样本分配给其所属的免疫簇。如图4e,发现簇C应答者百分比最高,其次是簇A,簇B应答者百分比最低。还计算了每个组中应答者的百分比:簇C平均有42%的应答者和58%的残余疾病患者,而簇B有18%/82%的应答者和13%/87%的残余疾病患者。由于pCR率作为ER状态的函数不同,还独立计算了ER阳性和ER阴性病例的应答者比例,发现无论ER状态如何,簇B的应答者比例最低(分别为补充图8A、B)。
对于每个对新辅助化疗有反应的队列,评估了pCR和非pCR病例在各免疫群中的分布。当考虑整个队列时,发现应答者在各免疫群组的分布有显著不同,簇B的应答者较少,簇C组的应答者居多;当按ER状态拆分时,虽然并非总是显著,但也观察到同样的趋势。这些结果表明,簇C中的患者有更高的概率成为应答者。研究结果还突出了簇B的低响应率,表明这类患者可能是新的新辅助治疗方案测试的候选人。
07 - 免疫簇的计算机剖析
为了评估集群中的逐渐免疫浸润是否可以解释与预后的关联,在Cox多变量回归分析中测试了免疫集群或总免疫浸润评分中哪一个对生存更有预测性。作者假设特定的免疫细胞类型混合物,而不是肿瘤微环境中的免疫细胞总数,可能是簇B预后差的原因。
使用CIBERSORT算法估计22种不同的免疫细胞类型的比例,对这种细胞类型特异性中位数浸润分数进行无监督聚类(图5a)。簇C病例中,富集了巨噬细胞M1、记忆激活T细胞和滤泡T辅助细胞(图5a),METABRIC和TCGA队列中CIBERSORT评分的分布也说明了这一点(图5b)。簇A如预期的那样,免疫细胞的水平非常低。在反应和预后较差的簇B中,发现巨噬细胞M2、静止肥大细胞和静止记忆T细胞的水平较高(图5a,图5b)。
使用广义线性模型,指定了区分簇B与簇A-C的免疫细胞类型(图5c)。还测试了哪些免疫细胞类型解释了簇A与簇B之间的差异和簇B与簇C之间的差异。
08 - 免疫簇的表型分析
通过差异基因表达分析确定了簇B中显著过度表达的基因,与簇A和簇C相比,簇B中有909个基因分别上调。这些基因与干细胞生物学和EMT相关,如使用MsigDB31的H和C2集合的基因集富集分析(GSEA)所示(图6a)。
为了进一步描述免疫簇与癌细胞表型之间的关系,使用了与EMT、干细胞、缺氧和增殖相关的基因集。使用GSVA方法计算了每个集群和队列的平均基因集富集分数,该分数反映了免疫集群中每个路径/基因集的活动。平均基因集分数的无监督聚类将免疫簇A和C分开,而簇B被分为两个亚组(图6b)。这些结果表明免疫簇与干细胞/EMT相关基因特征之间存在关联。
通过GSVA富集分数的无监督聚类,确定了乳腺癌中两个相互排斥的基因特征:(i)一个与增殖和胚胎干细胞样表型相关,(ii)另一个与EMT和乳腺干细胞表型相关。增殖表型在簇C中占主导地位(补充图11A),当计算每个代谢样品的基因集得分时也观察到了同样的情况(补充图11B)。在簇B中,EMT或增殖相关特征的平均基因集得分较高(补充图11C)。在代谢物组的样品水平上,我们观察到一个或另一个状态被激活的样品的类似模式(补充图11D)。簇A显示EMT和增殖状态得分较低(补充图11E,F)。
为了正式确定哪些基因集分数解释簇B,使用广义线性模型测试每个基因集的贡献程度。EMT标志对簇B有积极贡献,而增殖和细胞运动性与簇A和C相关(图6c)。还测试了当单独与簇A或簇C比较时,哪种基因集得分可以解释簇B。
09 - 肿瘤表型与免疫浸润的相关性
由于免疫簇与(i)免疫细胞类型和(ii)基因集特征相关,评估了免疫浸润(CIBERSORT)和癌细胞特征(基因集分数)之间的关系。图6d显示增殖和EMT分数与不同类型的免疫细胞显著相关。高EMT分数与巨噬细胞M2、静息肥大细胞和静息记忆T细胞相关,而高增殖与更活跃的适应性肿瘤微环境相关。这些数据表明癌细胞表型和肿瘤微环境的组成之间存在连续性。
簇B以致瘤免疫浸润为主,EMT信号高,但约35%的簇B也表现为增殖表型。为了探索簇B中的这种异质性,以无监督的方式根据基因特征分数将样本分组为B1以EMT表型为主,B2以增殖为主(图6e)。
在METABRIC和TCGA中,具有增殖表型的B2病例的预后较差(图6f,g)。为了进一步评估基因集评分的异质性是否伴随着免疫环境的异质性,作者寻求B1和B2亚群之间特异性免疫细胞类型的差异。补充图14中的无监督聚类显示,两个子聚类B1和B2都具有促肿瘤/静息免疫微环境。总而言之,簇B中两种相互排斥的状态可能与预后有关;然而,簇B的一个统一因素是存在促肿瘤/静息免疫微环境。
四、结论
在本研究中,发现了与临床相关的免疫簇与渐进性免疫浸润。在15个乳腺癌队列中,跨越6101个乳腺癌样本,肿瘤免疫浸润中等水平的患者群预后较差,与已知的预后分子和临床病理学特征无关。通过对群组免疫成分的表征,发现亲肿瘤免疫浸润与不良预后组相关。进一步的表型分析显示乳腺癌中存在两种相互排斥的侵袭性肿瘤表型,一种与EMT有关,另一种与增殖有关。这两种表型都是在不活跃/促肿瘤免疫微环境上发现的不良预后群。
GSVA全名Gene set variation analysis(基因集变异分析),是一种非参数,无监督的算法。与GSEA不同,GSVA不需要预先对样本进行分组,可以计算每个样本中特定基因集的富集分数。换而言之,GSVA转化了基因表达数据,从单个基因作为特征的表达矩阵,转化为特定基因集作为特征的表达矩阵。GSVA对基因富集结果进行了量化,可以更方便地进行后续统计分析。如果用limma包做差异表达分析可以寻找样本间差异表达的基因,同样地,使用limma包对GSVA的结果(依然是一个矩阵)做同样的分析,则可以寻找样本间有显著差异的基因集。这些“差异表达”的基因集,相对于基因而言,更加具有生物学意义,更具有可解释性,可以进一步用于肿瘤subtype的分型等等与生物学意义结合密切的探究。
基本原理
GSVA算法接受的输入为基因表达矩阵(经过log2标准化的芯片数据或者RNA-seq count数数据)以及特定基因集。 步,算法会对表达数据进行核密度估计;第二部,基于 步的结果对样本进行表达水平排序;第三步,对于每一个基因集进行类似K-S检验的秩统计量计算;第四步,获取GSVA富集分数。最终输出为以每个基因集对应每个样本的数据矩阵。
GSVA****术语解读
无监督算法
无监督算法常常被用于数据挖掘,用于在大量无标签数据中发现些什么。它的训练数据是无标签的,训练目标是能对观察值进行分类或区分等。
核密度估计
核密度估计(kernel density estimation)在概率论中用来估计未知的密度函数,属于非参数检验方法之一。
数据要求
1、特定感兴趣的基因集(如信号通路,GO条目等),列出基因集中基因
2、基因表达矩阵,为经过log2标准化的芯片数据或者RNA-seq count数数据(基因名形式与基因集对应)
下游分析
1、基因集(如信号通路)的生存分析
2、基因集(如信号通路)的差异表达分析
3、基因集(如信号通路)的相关性分析
图形示例:
图注
纵轴代表各个基因集(图中为信号通路),横轴代表各个基因集在不同分组的表达差异度(moderatedt-statistic)。
应用示例:
1、 GeneExpression Predicts Histological Severity and Reveals Distinct MolecularProfiles of Nonalcoholic Fatty Liver Disease . (于2019年8月发表在scientific reports,影响因子4.011)
基因表达数据预测非酒精性脂肪肝的组织学分期和分子分型
作者研究了非酒精性脂肪肝不同肝纤维化阶段和不同非酒精性脂肪肝活动度评分样本基因表达模式的差异。文中利用GSVA研究了不同肝纤维化阶段和不同非酒精性脂肪肝活动度评分样本中通路表达的差异。
2、 Immuno-subtypingof breast cancer reveals distinct myeloid cell profiles and immunotherapyresistance mechanisms ( 于2019年9月发表在 Nat Cell Biol. ,影响因子17.728 )
乳腺癌中与髓样细胞特征和免疫耐药机制相关的的不同免疫分型研究
作者利用小鼠模型研究了乳腺癌不同分型的免疫细胞和基因表达差异,文中利用GSVA研究了不同不同免疫分型中信号通路的表达差异。
肿瘤不是单纯的恶性细胞群,而是由不同类型细胞组成的复杂生态系统。在这些细胞中,肿瘤浸润免疫细胞在肿瘤控制和治疗反应中起着核心作用。例如,细胞毒性CD8 + T细胞是抗癌免疫的主要效应因子,因为它们可以特异性地识别和杀死携带新抗原的肿瘤细胞。肿瘤特异性抗原主要来源于突变基因的表达。但免疫细胞也可以发挥免疫抑制作用,支持肿瘤发生和免疫逃避,如调节性T细胞。因此,对不同类型的肿瘤浸润免疫细胞进行定量研究,有助于阐明肿瘤免疫应答的机制、评价肿瘤治疗的免疫原性作用,最终指导设计合理治疗方案。 背景介绍 最著名的 标记基因分析方法 是基因集富集分析(GSEA)。基于GSEA的方法计算富集分数(ES),当某一细胞类型的特异性基因在感兴趣的样本中处于高表达的前几位,而在其他情况下则处于低表达的前几位时,该分数较高。
基于GSEA的方法只能计算样本中细胞类型富集的半定量分数,而 反褶积方法 可以定量地估计感兴趣的细胞类型的相对分数。反褶积算法将异种样本的基因表达谱看作是不同细胞的基因表达水平的卷积,并利用描述细胞类型特异性表达谱的特征矩阵来估计未知的细胞组分。
下面是利用标记基因与GSEA或其他评分方法,或利用反褶积算法和免疫细胞表达特征,从 细胞混合物的表达数据量化免疫细胞 的计算方法。
下图是几个 从转录组学数据定量肿瘤浸润免疫细胞 的计算工具:
方法简介****01 基于标记基因的评分方法 (1)MCPcounter
一种基于标记基因定量肿瘤浸润免疫细胞(CD3 + T细胞,CD8 + T细胞,细胞毒性淋巴细胞,NK细胞,B淋巴细胞,单核细胞来源的细胞(单核细胞系),髓样树突状细胞,中性粒细胞)、成纤维细胞和上皮细胞的方法。对于每个细胞类型和样本,丰度得分为细胞类型特异性基因表达值的几何平均值,独立地对每个样本进行计算的。由于分数是用任意单位表示的,它们不能直接解释为细胞分数,也不能在细胞类型之间进行比较。进行定量验证时,估计分数与真实细胞分数之间具有很高的相关性,证明了MCP-counter用于样本间比较的价值。MCP-counter已应用于对32个非血液学肿瘤的19,000多个样本中的免疫细胞和非免疫细胞进行量化。
(2)TIminer
TIminer是一个用户友好的计算框架,用于不同的肿瘤免疫基因组分析,包括(i)来自NGS数据的人白细胞抗原HLAs基因分型;(ii)使用突变数据和HLA类型预测肿瘤新抗原;(iii)来自大量RNA-seq数据来分析定量肿瘤浸润免疫细胞;(iv)通过表达数据量化肿瘤的免疫原性。
(3)xCell
xCell是一种基于ssGSEA的方法,能够计算64种免疫细胞的丰度分数,包括适应性和先天免疫细胞、造血祖细胞、上皮细胞和细胞外基质细胞。基于FANTOM5,ENCODE,Blueprint,Immune Response In Silico (IRIS),Human Primary Cell Atlas (HPCA)和Novershtern等6个研究的489个基因集。对于每种细胞类型,计算xCell丰度分数的主要步骤有四个:(i)利用R包GSVA对489个基因集单独进行ssGSEA;(ii)对属于一种细胞类型的所有基因集的ES进行平均;(iii)平台特异性ES转化为丰度分数;(iv)使用与流式细胞术数据分析类似的spillover方法纠正密切相关的细胞类型之间的关系。
02 使用表达特征对细胞混合物进行反褶积 (1)DeconRNASeq
Gong和Szustakowski将约束回归模型应用于RNA-seq数据分析,并将其实现在R包DeconRNASeq中。混合五种人体组织(大脑、骨骼肌、肺、肝和心脏)的RNA-seq数据,通过合并组织类型特异性基因来估计组织或细胞类型的比例。并利用Illumina’s human Body Map 2.0中RNA-seq数据构建的特征矩阵,对算法进行了仿真验证。虽然还没有开发出新的免疫特征,但该工具原则上可以应用于任何特征矩阵。
(2)CIBERSORT
CIBERSORT算法利用微阵列数据构建特征矩阵,描述22种免疫细胞表型的表达特征,包括不同的细胞类型和功能状态的免疫细胞。CIBERSORT使用ν-SVR评估细胞分数。CIBERSORT分别在9个免疫细胞亚群和3个免疫细胞亚群的同时反褶积方面具有较高的准确性,在4种恶性免疫细胞的模拟混合物上测试,也证明了对不同程度的噪音和未知的肿瘤具有鲁棒性。
(3)TIMER
一个系统评估不同的免疫细胞对不同癌症类型的临床影响的资源。利用一系列免疫特异性标记和免疫细胞表达特征,来估计32种癌症类型中6种免疫细胞类型(B细胞、CD4 T细胞、CD8 T细胞、中性粒细胞、巨噬细胞和树突状细胞)的丰度。从RNA-seq或微阵列数据中提取的癌症表达矩阵与免疫细胞表达矩阵合并,并用Combat进行归一化,以消除批量效应。通过从免疫细胞标记中选择与肿瘤纯度负相关的基因,为每种癌症类型分别识别特征基因。最后,对于每种癌症类型,考虑到所选的免疫细胞标记,从标准化的免疫细胞配置文件构建特征矩阵。TIMER使用线性最小二乘回归方法执行反褶积,并强制所有负估计为零。用越来越小的一组T细胞标记重复估计几次,以减少CD8 +和CD4 + T细胞比例之间的相关性。与CIBERSORT不同的是,最终的估计并没有被规范化,因此不能直接解释为细胞组分,也不能在不同的免疫细胞类型和数据集之间进行比较。
(4)EPIC
Estimate the Proportion of Immune and Cancer cells (EPIC),用来估计免疫细胞和癌细胞比例。EPIC使用约束最小二乘回归明确地将非负性约束引入反褶积问题,并要求每个样本中所有细胞组分的总和不超过一个。EPIC克服了以往从大量肿瘤基因表达数据预测癌症和免疫细胞或其他非恶性细胞类型的方法的几个局限性,考虑了非特征性和可能高度可变的细胞类型,并在算法上得到了发展。能够广泛应用于大多数实体肿瘤,如黑色素瘤和结直肠样本验证的情况,但不适合血液恶性肿瘤,如白血病或淋巴瘤。
(5)quanTIseq
quanTIseq是专门为RNA-seq数据开发的反褶积工具,能够准确定量未知肿瘤的含量,以及量化整体组织的免疫细胞组份。基于约束最小二乘回归和一个新的特征矩阵(来自51个纯化或富集的免疫细胞类型的RNA-seq数据集)。quanTIseq实现了一个完整的反褶积流程来分析RNA-seq数据,能够避免混合物和特征矩阵之间的不一致性。
03 细胞组分和表达谱的同时反褶积 (1)DSA
数字排序算法Digital Sorting Algorithm—DSA是一个完整的反褶积算法,它基于一组从混合组织样本中提取在特定细胞类型中高度表达的标记基因,利用二次规划来推断复杂组织中的细胞组分和表达谱。该算法在三种恶性免疫细胞系混合的微阵列数据上进行了测试,重建了真实的细胞组分和表达谱。该算法是无偏的,不需要细胞类型频率的先验知识。
我总结 今天我们简单介绍了一些关于免疫浸润的方法,之后会有更多详细的压箱底使用方法分享,不要错过呀。REF:Finotello, F., Trajanoski, Z. (2018). Quantifying tumor-infiltrating immune cells from transcriptomics data. Cancer immunology, immunotherapy : CII, 67(7), 1031–1040.
#关注新冠肺炎,宣传相关知识#
免疫系统的“疫”字就可以表明人类对此认识是从瘟疫开始的,随着医学不断进步,人们对免疫系统也有了全新的认识,功能概括起来有3方面, 一是识别、清除外来微生物,二是识别、清除内在叛乱分子,如癌细胞,三是清除衰老的细胞或其它有害物质。
免疫系统由免疫器官组织、免疫细胞、免疫分子构成。
免疫器官组织,比如骨髓、脾脏、淋巴结等。
免疫细胞,比如T 细胞、B 细胞、NK 细胞、巨噬细胞等。
免疫分子,比如免疫球蛋白(抗体)等。
免疫细胞由骨髓、胸腺产生,成熟之后就被安排到各个前沿关口、阵地,比如淋巴结,粘膜下层的淋巴组织、脾脏,这些地方也是免疫系统与“异己分子”、包括外来微生物大战的地方!人体器官所有的粘膜面积加起来大概有400平方米。
病原微生物入侵人体,多以粘膜为突破口,免疫系统布置在各个关口、阵地的NK细胞、巨噬细胞首先对病毒进行围攻、歼灭!这是人体的固有免疫反应,反应速度快,但作用力要弱一些,同病原微生物作战的过程中也会释放狼烟信号!
接到求救信号之后,免疫系统的精锐部队要冲上去,首先是T细胞,分成三队,一队留守,一队投入战斗,还有一队去和B细胞汇合!干什么去呢?制造大量的 抗体 ,一种蛋白质,抗体与抗原(病原体)结合使抗原瘫痪,免疫系统取得胜利!
抗体产生是被动、获得性免疫,多在病原微生物入侵4-5天后形成,也是注射疫苗想要的结果!我是@刘永毅医生 ,感谢您的阅读!
(医患家特约回答:交大丫丫博士)
人类免疫力包括与生俱来的“固有免疫”和后天获得的“适应性免疫”(即我们常说的免疫力)。从另一个角度,人体免疫又分为细胞免疫和体液免疫,我们经常说的“产生抗体”是指适应性免疫中的体液免疫。
人体对于新的病原体或者“抗原”产生抗体的基本过程是这样的:病原体进入人体以后,被吞噬细胞、B淋巴细胞(来源于骨髓bone而得名)等摄取并处理成蛋白肽的“碎片”,这个碎片被提交给T淋巴细胞(来源于胸腺Thymus而得名),T淋巴细胞被激活以后,分泌细胞因子,刺激B淋巴细胞分化成熟为浆细胞,并产生相应抗体。
免疫细胞和免疫系统的基本功能是辨识抗原“是我”还是“非我”,如果它认为这个抗原“非我”,便会被激活产生抗体(体液免疫)以及效应T细胞(细胞免疫)。“从没见过的病原体”可能是无穷无尽的,那么,我们的免疫细胞能够产生无穷无尽种类的抗体吗?一方面,免疫细胞在辨别外来抗原的时候,并不需要一个个去辨认全部氨基酸,而是辨认特定位置的氨基酸,即特定的序列组合或者结构组合便可引起免疫反应。也就是说,我们对某种病毒有抗体之后,对它的近亲病毒也会有一定程度的抵抗力。
从某种程度上,并不需要“无穷无尽”种类的抗体。另一方面,我们的抗体产生能力和6号染色体的人白细胞抗原(HLA)基因相关。这个区段的基因,是人体基因组中最具有多态性、表达最为复杂的。HLA基因及其表达决定了不同的人对于病原体的抗体产生能力(抵抗力)及疾病反应性不同。因此即便是从没见过的病原体,我们也能够产生数量和功能因人而异的抗体。HLA还是最可靠的人类遗传标记,在亲子鉴定和法医学中得到重要应用。不久前南京警方破获28年前的刑事案件,如果说利用Y染色体能够确定疑犯家族的话,结合HLA基因便可以万无一失地确定嫌疑人。
抗体定义: 是一种由浆细胞(B细胞)分泌,能特异性识别特定外来物的Y型蛋白。该外来目标被称为抗原
两条轻链 两条重链
抗体如何发挥功能
1、针对进入正常细胞的病原体 细菌 抗体本身不能直接溶解或杀伤带有特异抗原的靶细胞(被病原体侵入的细胞成为靶细胞),通常需要补体或吞噬细胞等共同发挥效应以清除病原微生物或导致病理损伤。
2、针对游离在细胞外的病毒 抗体可通过与病毒或毒素的特异性结合,直接发挥中和病毒的作用。
抗体特点:
特异性:每一种抗体特异性识别某一种或一类抗原
多样性:人体内可以产生多种多样的抗体
人体为什么可以产生多种多样的抗体: 利根川近因发现“抗体多样性的遗传学原理”被授予1987年诺贝尔生理学或医学奖
在利根川进未解释抗体多样性产生原因前,免疫学家们为抗体起源分成两大派系。其一的种系理论认为制造抗体的基因来自于遗传密码的一部分(每种抗体有专一基因负责);而另一派系体细胞突变理论认为抗体基因自身重新组合编码而衍生出新的抗体。(一小部分基因能够产生众多变体)。 利根川进通过演示一个DNA分子的突变和重组或重新排列,证明了“体细胞突变”理论。此过程可制造出多达100亿种抗体,利根川进发现突变的基因片段是由一条条貌似非活跃或未编码的DNA带隔开的,这些DNA带被称为基因内区。他还发现这些基因内区中包含着一种基因控制成分,名为强化因子。抗原出现可以促进强化因子发挥作用促进抗体基因编码产生抗体。
据人们统计自然界病毒和细菌大约有10万种,而人体内的免疫细胞基因有1亿一种排列组合。也就是说几乎自然界任何一种病毒在人体内都有对应的抗体。
发展至今关于回答抗体多样性可以从以下五个方面:
1、 编码抗体基因本身具有多样性(原始原因)
2、 基因重排产生多样性(根本原因)
3、 轻链重链的随机组合
4、 不准确的连接、核苷酸插入
5、 体细胞高频突变
如果把们的身体比喻成一个独立的国家的话,那免疫系统就是我们的军警系统,不仅可以作为军队识别和清除外来入侵的病原生物,还能作为警察识别清除体内发生突变的细胞、衰老死亡的细胞或其他有害成分。免疫系统可以保护我们的身体,防御外敌入侵,保持机体的 健康 状态。没有免疫系统,我们的身体就会受到细菌,病毒,寄生虫等外来攻击。
免疫系统遍布全身,涉及许多类型的细胞、器官、蛋白质和组织。这个巨大的细胞和组织网络一直在寻找入侵者,一旦发现敌人就会发起复杂的攻击。免疫系统是智能的,可以区分我们自身的组织与外来组织,可以识别正常的细胞与死亡和有缺陷的细胞。
当免疫系统遇到病原体,例如细菌,病毒或寄生虫,即产生免疫反应。那么免疫系统如此复杂而又精密的系统是如何工作的呢?
首先,我们介绍免疫系统的哨兵:白细胞
白细胞在血管和淋巴管中进行循环,不断巡逻并寻找病原体;当他们找到目标时,就开始繁殖并将信号发送到其他类型的免疫细胞(也就是喊人),募集免疫杀伤细胞进行灭敌。
有兵就需要兵营,为免疫系统持续产生、培训新的兵力。在体内储存白细胞的部位称为淋巴器官,其中包括:
大本营:骨髓——骨骼的中心,产生白细胞、红细胞。
训练营:胸腺——肺部和颈部下方的腺体,T细胞在胸腺发育成熟。
战场:淋巴结——遍布全身的小腺体,由淋巴管连接。
屠杀场:脾脏——位于腹部的左上方,过滤血液的器官。
关键词:免疫细胞基因集