基因集富集分析(Gene Set Enrichment Analysis, GSEA)
发布网友
发布时间:2024-09-25 20:41
我来回答
共1个回答
热心网友
时间:2024-10-04 18:45
GSEA(Gene Set Enrichment Analysis)是一种独特的基因集分析方法,与传统基因富集分析有显著区别。传统分析往往忽视基因表达量变化趋势,只关注基因分布,无法准确判断通路是被激活还是抑制。GSEA则采用基因矩阵转置文件(gmt)中的预定义基因集,通过基因表达与表型关联的排序,判断基因集内基因的协同变化对表型影响。输入为基因表达量矩阵,通过排序和富集分数(ES)评估基因集在上调或下调趋势中的位置,从而提供更深入的生物学解释。
解读GSEA结果时,关注富集分数曲线、基因与表型的关联矩阵、富集得分贡献最大的基因子集(Leading-edge subset)以及FDR(False Discovery Rate)控制。FDR小于0.25通常被认为是可信的富集,但在样本量小或使用特定permuation type时,需要更严格的FDR标准。
在R语言中,可通过fgsea包或clusterProfiler包进行GSEA分析。首先,需要准备rank文件(排序的基因列表)和gmt文件。fgsea包会检查基因集在差异表达基因中的富集情况,显示 NES、pval和padj,以及标准化的ES( NES)。clusterProfiler包则提供气泡图展示显著富集的通路,并可视化特定通路的富集结果。