2026年3月30日 研究日志¶
今日主题:阅读文献Integration of eQTL and a Single-Cell Atlas in the Human Eye Identifies Causal Genes for Age-Related Macular Degeneration 并整理相关学习笔记
文章特点:正如我之前(03/17)所阐述的那样,这篇文章提供了丰富的细胞类型特异性基因表达数据。这也是我反复研究这篇文献的原因。这篇论文提供了丰富的数据和具体的实验和统计方法,参考意义较大。
总体来说本实验进行了以下三个步骤:
- 使用来自129只人类捐献眼的视网膜色素上皮/脉络膜和视网膜组织样本(包括黄斑区和非黄斑区,即周边区)进行批量RNA测序,并分析了其中121只捐献眼的单核苷酸多态性(SNP)基因分型;
- 对来自黄斑区和非黄斑区的视网膜色素上皮/脉络膜和视网膜组织样本进行表达数量性状位点(eQTL)分析,以鉴定顺式eQTL(cis-eQTLs);
- 对来自5名捐献者的人眼进行单核测序(Single nuclei RNA-seq/snRNA-seq/NucSeq)。
学习笔记:什么是eQTL分析?¶
eQTL全称为表达数量性状基因座(Expression Quantitative Trait Loci, eQTL),是指基因组中能够系统性地影响特定基因在mRNA水平上表达丰度的遗传变异位点(简单来说就是那些能够影响基因表达量的基因位点),这种变异位点通常是单核苷酸多态性(SNP)。eQTL分析的核心在于通过统计学方法(如线性回归模型)将个体的基因型数据与其在特定组织、细胞类型或环境条件下的全基因组基因表达谱进行关联,从而识别出那些对基因表达具有显著调控作用的遗传位点。
这是一个在表达组学中非常核心的工作。有一个我曾经以为大家都知道,但似乎并不是这样的事实:人类基因组中绝大多数与复杂性状或疾病相关的遗传变异位点(通常通过全基因组关联研究GWAS识别)并不位于蛋白质编码区(即外显子),而是富集于非编码调控区域。具体而言,人类基因组中仅有约1.5%的序列直接编码蛋白质,而超过90%的GWAS显著信号落在非编码区域。这些非编码变异之所以具有生物学意义,是因为它们往往通过调控基因表达来间接影响表型。正因如此,确定什么变异是特定疾病相关的变异是一个富有挑战又极为必要的任务。
An eQTL is a genetic variant that changes how much a gene is expressed — like a knob that turns a gene’s output up or down. If gene expression is the label, and genotype is a feature, an eQTL is a feature that has a statistically significant effect on the label. (AI genarated, Microsoft CoPilot)
学习笔记:什么是cis-eQTL?¶
eQTL可以分为顺式(cis-eQTL)和反式(trans-eQTL)两种。顺式eQTL实际上就是指的是位于其调控靶基因附近(通常定义为转录起始位点上下游1兆碱基对范围内)的遗传变异。反式则是远离其靶基因的eQTL,甚至可能位于不同的染色体上。这篇文章进行的是顺式eQTL分析。原文方法部分如下:
We used the R package MatrixEQTL (Shabalin, 2012) to identify SNPs whose genotypes were associated with gene expression of nearby genes, also known as local or cis-eQTL. For every gene, we restricted eQTL discovery to SNPs located within 1Mb upstream and 1Mb downstream of the gene. For eQTL analysis, we selected ‘‘expressed genes’’ with normalized RPKM (nRPKM) greater than 0.1 in at least 10 donors, resulting in 31,560 genes. We transformed expression levels using rank based inverse normal transformation. We computed PEER factors from the transformed expression with the R package PEER (Stegle et al., 2012), with the aim to remove effects of confounding variables from the gene expression matrix. Our choice of 15 PEER factors is a conservative approach that aims to capture even moderate-to-low strength confounders. We used the following linear regression to identify SNPs associated with gene expression while controlling for covariates, including 3 ancestry PCs, sex as determined from RNA-seq, RNA-seq batch, genotyping batch, AMD status, and 15 PEER factors: $$Expression \sim SNP + ancestry + sex + RNAseq batch + Genotype batch + PEER factors$$ After genotyping and QC, 98 control and 23 AMD donors were retained (n = 121) for subsequent eQTL analysis. The number of donors with both genotyping and expression data per tissue was 106 for retina macula, 111 for retina non-macula, 106 for RPE macula, and107 for RPE non-macula.
顺带一提,顺式与反式本来是经典遗传学概念,顺式指位于同一条染色体上,反式指位于不同染色体上。
学习笔记:什么是snRNA-seq?¶
单核测序是一种特殊的单细胞测序,它通过在单个细胞核的分辨率上对基因表达谱进行分析,从而克服了传统单细胞RNA测序(scRNA-seq)在处理特定类型组织时面临的关键局限。该技术的核心在于分离完整的细胞核而非完整的活细胞。snRNA-seq的根本优势源于细胞核相对于完整细胞所具有的物理稳健性。许多生物组织,特别是成年哺乳动物的大脑、脂肪组织、纤维化肝脏或经过冷冻保存的临床样本,其细胞在进行酶解离以制备单细胞悬液的过程中极易受损或死亡。snRNA-seq通过直接从组织匀浆中分离细胞核,通常采用温和的机械裂解结合蔗糖梯度离心等纯化步骤,有效规避了这些难题。这使得研究人员能够利用宝贵的存档冷冻组织(如生物银行中的样本)进行高质量的转录组分析,极大地扩展了研究材料的来源。
结果¶
大多数AMD候选基因在RPE中表达,并利用eQTL鉴定了13个AMD风险位点的15个推定致病基因。这些基因包括在RPE中高表达的基因,例如四跨膜蛋白10 (TSPAN10) 和瞬时受体电位阳离子通道亚家族M成员1 (TRPM1),以及先前已鉴定的基因,例如跨膜蛋白199 (TMEM199) 和溶酶体相关细胞器生物合成复合物1亚基1 (BLOC1S1)。
数据¶
数据集:
GSE135092(批量测序数据集) https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE135092
GSE135133(单核测序数据集)https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE135133
测序结果:
单核测序结果保存在Broad研究所的单细胞门户网站(Single-Cell Portal)中,研究编号为SCP484:https://singlecell.broadinstitute.org/single_cell/study/SCP484/nucseq-from-human-control-eyes-scrnaseq
眼eQTL结果可在 http://eye-eqtl.com 网站上找到。
Reference¶
Orozco, L. D., Chen, H. H., Cox, C., Katschke, K. J., Arceo, R., Espiritu, C., Caplazi, P., Nghiem, S. S., Chen, Y. J., Modrusan, Z., Dressen, A., Goldstein, L. D., Clarke, C., Bhangale, T., Yaspan, B., Jeanne, M., Townsend, M. J., van Lookeren Campagne, M., & Hackney, J. A. (2020). Integration of eQTL and a Single-Cell Atlas in the Human Eye Identifies Causal Genes for Age-Related Macular Degeneration. Cell Reports, 30(4), 1246-1259.e6. https://doi.org/10.1016/j.celrep.2019.12.082