
博茨瓦纳国际科学与技术大学(Botswana International University of Science and Technology)联合法国图卢兹国立理工学院的研究团队另辟蹊径,将目光投向人体呼出气中的挥发性有机化合物(VOCs)。这些代谢"指纹"不仅能反映肺部病理状态,其采集过程还具有完全无创、可重复性强的独特优势。通过整合机器学习与严格的混杂因素控制策略,该研究建立了肺癌诊断的新范式,相关成果发表于《Scientific Reports》。
研究团队采用气相色谱-质谱联用(GC-MS)分析52名参与者(含20例肺癌、10例肺结核和22例对照)的99份呼气样本,通过OpenChrom软件和NIST质谱库鉴定化合物。运用曼-惠特尼U检验排除吸烟、性别等干扰因素后,采用PLS-DA等机器学习模型评估生物标志物的诊断效能。
结果
呼出气VOCs谱特征
典型肺癌患者的离子流色谱图显示多个特征峰,包括首次报道的2-溴十二烷、十五醛等化合物。校准曲线验证仪器灵敏度(R2>0.99),关键标志物邻伞花烃在肺癌组浓度(17.62 ppm)显著高于对照组(5.54 ppm)。
混杂因素控制
通过分层分析发现,邻苯二甲酸二乙酯等化合物受癌症分期影响,而苯乙酸等与吸烟显著相关(p<0.05)。最终筛选出10种不受混杂因素干扰的VOCs,其中2,3,6,7-四甲基辛烷的Cliff's delta效应值达0.63,展现强区分力。
机器学习模型性能
PLS-DA模型在区分肺癌与对照组时展现最优性能:灵敏度82%、精确度90%、F1值86%。引入肺结核数据后,模型仍保持88%的稳定性能,证实标志物特异性。ROC曲线分析显示AUC达0.96,显著优于支持向量机(0.89)和K近邻算法(0.85)。
讨论与意义
该研究创新性地将化学分析与人工智能相结合,建立了一套可消除"疾病异质性"干扰的分析框架。首次报道的2-溴十二烷等化合物,为理解肺癌代谢机制提供了新线索。尤其值得注意的是,模型对肺结核的鉴别能力解决了呼吸系统疾病诊断中的"假阳性陷阱"问题。
这项研究不仅为开发便携式肺癌呼气诊断仪奠定了技术基础,其"机器学习+混杂控制"的双重验证策略,更为生物标志物研究提供了方法论范式。随着后续大样本验证的推进,这种无辐射、低成本的技术有望成为肺癌早期筛查的重要工具,让"闻气识癌"的愿景照进现实。
转载请注明:可思数据 » 机器学习结合呼出气挥发性有机物分析建立肺癌诊断新框架
免责声明:本站来源的信息均由网友自主投稿和发布、编辑整理上传,或转载于第三方平台,对此类作品本站仅提供交流平台,不为其版权负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。若有来源标注错误或侵犯了您的合法权益,请作者持权属证明与本站联系,我们将及时更正、删除,谢谢。联系邮箱:elon368@sina.com