image: 图1多任务级联森林框架的技术路线图 view more
Credit: Copyright © 2026 Kunhong Liu et al.
1研究背景
化合物的毒性评估在医疗、工业和农业领域中至关重要,其目的在于确保进行严格的安全性测试,防止化合物毒性对环境和生物造成危害。多物种急性毒性预测(Multi-Species Acute Toxicity Prediction, MSATP)是毒性评估中一个关键且极具挑战性的任务。传统方法依赖于体内动物实验与体外技术相结合的方式,不但成本高昂且耗时费力。此外,对实验动物的广泛使用在全球范围内引发了严重的伦理争议。随着国际大型药企在毒性实验数据上的不断积累,机器学习作为一种快速、精确、低成本的可替代方法应运而生,它为减少对动物实验的依赖提供了有效的解决方案。
2研究进展
当前MSATP上的研究大都使用多任务深度神经网络进行建模,然而很多子任务(毒性终点)的特点是表格型、小尺寸、高维度且特征稀疏,经常造成网络模型在不同子任务上的泛化能力不足。为了处理这个问题,本研究提出一种全新的多任务级联森林框架,它整合了基于知识迁移的特征增强策略、以及基于协方差度量和贪心检索的样本增强策略,适用于不同尺寸的子任务学习(图1)。
对比于目前该领域最先进的神经网络方法,提出的框架在59个毒性终点上的平均预测性能实现了12%的提升。图2展示提出的框架和现有神经网络方法在59个毒性终点上的性能比较,曲线和条形分别代表所提框架和7个对比方法的回归性能。
此外,在化合物的单视图语境下本研究执行了模型消融实验来验证不同增强策略的有效性,同时引入多个外部数据集评估所提框架在未知物种上的泛化能力。在多视图语境下,特征融合策略和共识集成策略被证实可以进一步提升所提框架的性能。最后,本研究通过比较不同毒性终点上的特征重要性向量,为不同物种间的毒性相关性提供了可解释的见解。
3未来展望
总体而言,本研究有效地解决了神经网络在MSATP上泛化能力不足的缺陷,并在各种毒性预测领域展现出巨大的应用潜力。所提框架主要依赖特征增强和样本增强提升模型在不同毒性终点上的预测能力。前者借鉴了级联森林中类概率向量的拼接,但其他研究指出使用更复杂的表达有助于进一步提升特征表示,例如基于沙普利的特征增强或基于树嵌入的特征增强。后者以矩阵间的协方差距离作为指导,通过贪心近邻方法检索近距离的毒性终点,但该策略忽视了远距离终点中的关联样本,在后续研究中多任务聚类方法或许可以作为有效的手段来解决这个瓶颈。
原文链接:https://spj.science.org/doi/10.34133/research.1046
Journal
Research
Method of Research
News article
Subject of Research
Not applicable
Article Title
Multi-Task Cascade Forest Framework for Predicting Acute Toxicity across Species
Article Publication Date
15-Jan-2026