关注  微信公众号 大数据讨论 ,第一时间 分享5G 智能应用 平台 小程序 相关信息。
群主微信号  wenmijiayuan,加微信,进群线上交流

青岛能源所发明了基于菌群大数据搜索的疾病检测方法

微生物组与人体、环境的健康有着千丝万缕的关联。同时,菌群检测具有非侵入性、可量化、可预警等优势。因此,如何用菌群来判断和识别人体或环境的健康状态,一直是精准医学和大健康的热点问题之一。

  但作为一种疾病诊断手段,菌群面临着三个关键的挑战:首先是漏诊问题,现有的检测手段通常只针对于特定疾病,并依赖于该疾病已知的标志微生物来构建检测模型。然而很多疾病尚无明确标志物,而且同一种疾病在不同人群中的生物标志物种经常不一致,因此难以普适性地判断待检样本是否健康。其次是“误诊”问题,同一种生物标志经常与多种疾病相关联,导致难以准确分辨具体的疾病类型。第三,由于元基因组数据的极端高通量、高度异质性、多种测序平台共存等特点,菌群诊断模型的构建、训练和更新,均具有突出的挑战性。

  针对上述关键问题,青岛能源所副研究员苏晓泉带领的单细胞中心组群生物信息研究组,利用前期开发的微生物组搜索引擎MSE,发明了基于菌群大数据搜索的疾病检测新策略。

与现有基于模型训练的机器学习手段相比,该方法不再依赖于疾病相关的特定标志微生物,而是利用待测菌群元基因组与已有菌群元基因组大数据的整体相似度来实现检测。

那么,这一疾病检测新策略是如何开展工作的?
首先,计算待测样本相对于数据库中所有健康样本的异常程度,即可评估其是否健康。其次,与数据库中的多种疾病的参照样本进行比对,即可识别具体的患病种类。基于超过3000例肠道菌群样本的测试表明,针对炎症性肠病、结直肠癌、艾滋病病毒感染和肠腹泻病等,MSE回答“是否健康”和“哪种疾病”这两个问题的准确率均超过80%,显著高于目前常用的机器学习算法,从而有效降低了漏诊和误诊的可能。

  此外,与常规手段相比,该方法在跨研究、跨测试人群、跨测序平台、样品污染等因素影响下的适应性和抗干扰能力,也具有显著优势。

发表评论

电子邮件地址不会被公开。 必填项已用*标注

豫ICP备11014216号