文献周报 | OSA与肌少症共享生物标志物:纯生信研究的发表逻辑与借鉴

文献:Jiang F, et al. Identification of shared biomarkers for obstructive sleep apnea and sarcopenia via differential expression and WGCNA analysis. Sleep Breath. 2026.
整理:Roger
更新日期:2026-04-15
标签:阻塞性睡眠呼吸暂停 | 肌少症 | WGCNA | 共享生物标志物 | 生信分析


一、为什么读这篇

这是今年发表的一篇纯生信文章,研究对象是OSA与肌少症的共享生物标志物。之所以选这篇精读,是因为它回答了一个常见疑问:

"纯生信,没有实验验证,什么样的文章才能发表?"

这篇提供了一个可参考的答案。


二、研究背景

临床现象:OSA与肌少症均为增龄相关疾病,临床上常合并出现。OSA患者因夜间低氧和睡眠片段化,可通过炎症通路(NF-κB)、氧化应激、蛋白合成受损等机制促进肌肉消耗;而肌少症导致的肌肉无力又会加重上气道塌陷,形成恶性循环。

科学问题:两病共病的分子机制尚不清晰,是否存在共同的基因表达改变?

研究假设:OSA与肌少症之间存在共享的生物标志物,可作为两病共病的分子桥接证据,同时具备诊断模型开发价值。


三、数据与方法

3.1 数据来源

数据集 疾病 平台
GSE135917 OSA GEO
GSE1428 肌少症(Sarcopenia) GEO
GSE38792 OSA验证集 GEO
GSE111006 肌少症验证集 GEO

3.2 分析流程

  1. 差异表达分析(DEGs):分别在两个数据集中筛选疾病组 vs 对照组的差异表达基因
  2. WGCNA共表达网络分析:构建基因共表达模块,筛选与性状相关的核心模块
  3. 共享基因交叉定位:取DEGs与WGCNA模块基因的交集(Venn图),得到候选共享基因
  4. 功能富集分析:GO + KEGG + GSEA,解释候选基因的生物学功能
  5. 诊断模型构建:基于3个关键基因构建Nomogram诊断模型
  6. 多维度验证:ROC曲线 + Calibration曲线 + DCA决策曲线 + 外部独立数据集验证
  7. 免疫浸润分析:CIBERSORT算法分析两组疾病的免疫细胞构成差异

3.3 关键方法参数

参数 设置
差异分析FDR校正 FDR < 0.05,|logFC| > 1
WGCNA soft-threshold OSA: R2=0.80;肌少症: R2=0.90
免疫浸润算法 CIBERSORT
统计方法 双样本t检验 + 双侧ANOVA(Tukey post hoc)

四、主要结果

4.1 差异表达与共享基因

在两个数据集中分别筛选出差异表达基因后,取交集得到123个共享DEGs。这些基因富集于肌肉功能、细胞应激、代谢紊乱和神经退行性相关通路。

Figure 2

图2. 差异基因筛选火山图、热图及富集分析结果。(A-B)GSE135917和GSE1428的DEGs火山图;(C-D)热图;(E-F)GO和KEGG富集分析;(G)123个共享DEGs的Venn图;(H)共享DEGs的KEGG通路分析。

4.2 WGCNA模块分析

通过WGCNA构建共表达网络,鉴定出与OSA和肌少症性状高度相关的核心模块,进一步与DEGs交叉定位,得到9个高度可信的共享候选基因。该步骤的关键结果包括:

  • 软阈值筛选:OSA数据集选取R2=0.80对应的power值;肌少症数据集选取R2=0.90
  • 模块-性状相关性热图显示多个模块与疾病状态显著相关
  • Venn图定位9个同时存在于两个疾病WGCNA模块中的共享基因

图3Fig. 3

4.3 关键共享生物标志物

经过DEGs + WGCNA双重筛选,最终锁定3个核心基因

基因 功能注释
ESF1 进化保守的核蛋白,参与核糖体生物合成和细胞增殖调控
ZNF117 锌指蛋白,参与转录调控和蛋白质相互作用
C2orf49 2号染色体开放阅读框,功能尚未完全阐明

Figure 5

图5. 三个关键基因的表达量与诊断价值评估。(A-C)ESF1、ZNF117、C2orf49在训练集的表达;(D-F)验证集的表达;(G-I)各基因ROC曲线;(N-O)Nomogram模型在两个数据集的ROC表现。

4.4 诊断模型表现

数据集 疾病 训练集 AUC 验证集 AUC
GSE135917 / GSE38792 OSA 0.912 0.787
GSE1428 / GSE111006 肌少症 0.967 0.744

4.5 免疫浸润分析

CIBERSORT分析显示,OSA和肌少症组中促炎免疫细胞(如M1巨噬细胞、活化NK细胞)比例均显著升高,且关键基因表达与促炎细胞浸润呈正相关,提示免疫炎症是两病共享的病理基础。

Figure 7

图7. 两组疾病的免疫细胞构成分析及与关键基因的相关性。(A-C)OSA组免疫细胞构成;(D-F)肌少症组免疫细胞构成;(C、F)关键基因与免疫细胞的相关性热图。


五、为什么这篇纯生信能发表?

5.1 临床假设创新性强

不是单纯的"OSA生信分析",而是跨疾病的共享生物标志物研究——这是两种在临床上确实存在共病的疾病,机制上有合理的病理生理关联假设。

5.2 分析链条完整,没有明显短板

DEGs + WGCNA + 功能富集 + 诊断模型 + 多维度验证 + 免疫浸润,每一步都有且衔接紧密。

5.3 外部独立验证是硬通货

有独立的验证数据集(GSE38792、GSE111006),且验证集AUC仍在0.74-0.79区间——双疾病、双验证集的配置显著提升了结论可信度。

5.4 诊断模型+DCA增加了临床转化价值

不仅找了基因,还构建了Nomogram并做了DCA决策曲线——这让文章从"机制探索"升级为"临床工具开发"。

5.5 期刊选择精准

发表在Sleep Breath(ESCI),专业对口接收这类"睡眠疾病+生信"的研究。


六、值得借鉴的方法与思路

6.1 分析框架可以直接迁移

对于OSA认知障碍方向,研究逻辑完全可以套用:

OSA数据集(GEO) + 认知障碍数据集(GEO)
→ DEGs分析
→ WGCNA共表达网络
→ 与TRPM2/CREB/BDNF通路基因交叉定位
→ 构建诊断模型
→ 外部验证
→ 免疫浸润分析

6.2 "双重筛选"策略值得学习

DEGs + WGCNA模块基因取交集,比单纯DEGs更有生物学意义——筛选出的基因在共表达网络中本身就有关系,不只是统计显著。

6.3 免疫浸润是加分项

CIBERSORT分析已经是纯生信的"标配加分项",且这篇文章将其与关键基因表达做了相关性分析,形成了从基因到免疫微环境的完整叙事。

6.4 Nomogram + DCA是可视化亮点

Nomogram对于临床医生读者非常直观,DCA则量化了模型的临床净获益。这两个图在投稿时能给reviewer留下深刻印象。

6.5 对Roger课题的直接启发

姜黄素改善OSA认知障碍的研究,完全可以在GEO上做:

  • 用认知障碍数据集(如阿尔茨海默病、认知损害相关数据集)作为认知障碍对照
  • 与OSA数据集取交集
  • 关注TRPM2/CREB/BDNF通路的基因表达变化
  • 用姜黄素处理IH细胞或动物的RNA-seq数据做进一步验证

这样生信是"上游筛选",动物实验是"下游验证",逻辑链条完整。


七、参考文献

  1. Jiang F, et al. Identification of shared biomarkers for obstructive sleep apnea and sarcopenia via differential expression and WGCNA analysis. Sleep Breath. 2026. PMID: 41784837 IF: 2.0 Q3 .
  2. Gozal D, et al. Cognitive dysfunction and metabolic alterations in rats with chronic intermittent hypoxia. Am J Respir Crit Care Med. 2003.
  3. Gold PE, et al. Behavioral and molecular responses to intermittent hypoxia. Am J Respir Crit Care Med. 2003.

本文为文献周报,如有解读不当之处,欢迎交流指正。

© 版权声明
THE END
喜欢就支持一下吧
点赞13 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容