亚太传统医药 ›› 2025, Vol. 21 ›› Issue (2): 138-145.DOI: 10.11954/ytctyy.202502028

• 传统医药信息学 • 上一篇    下一篇

基于生物信息学与机器学习识别阳虚质强直性脊柱炎关键基因

崔家伟,杨磊,史相钦,高轩,朱言,张红星   

  1. 河南省洛阳正骨医院/河南省骨科医院
  • 出版日期:2025-02-05 发布日期:2025-02-18
  • 基金资助:
    河南省中医药科学研究专项课题(20-21ZY2252)

  • Online:2025-02-05 Published:2025-02-18

摘要: 目的:利用生物信息学与机器学习筛选阳虚质强直性脊柱炎(AS)中的关键基因。方法:从GEO数据库获取GSE87474中平和质和阳虚体质人群的数据以及AS相关的数据集GSE181364。分别利用Limma包和Wilcox Test筛选数据集中的差异表达基因(DEGs),并将两类DEGs进行交集,确定阳虚质AS相关基因。使用支持向量机-递归特征消除(SVM-RFE)和最小绝对值收敛与选择算子(LASSO),识别阳虚质AS相关基因中的关键基因,并利用pROC包绘制关键基因的受试者工作特征(ROC)曲线,以评价其诊断效能。结果:从GSE87474数据集中筛选出455个与阳虚质相关的DEGs,从GSE181364数据集中筛选出1525个与AS相关的DEGs,两者取交集后获得16个阳虚质AS相关基因,Lasso与SVM-RFE算法从16个相关基因中鉴定出5个关键基因,即纺锤家族成员4(SPIN4)、跨膜蛋白68(TMEM68)、锌指蛋白92(ZNF92)、瘦素受体重叠转录样1(LEPROTL1)、G蛋白偶联受体183(GPR183)。ROC分析结果显示,5个关键基因均表现出良好的诊断阳虚质和AS的效能。结论:发现SPIN4、TMEM68、ZNF9、LEPROTL1、GPR183可能为阳虚质AS的潜在关键基因,可为进一步阐明阳虚质AS的生物学机制及潜在临床诊断标志物,为从中医体质“体病相关”学说论治AS提供新的思路。

关键词: 阳虚质;强直性脊柱炎;生物信息学;机器学习;生物标志物