本研究提出了一种名为 GraphSynergy 的网络启发深度学习模型,用于抗癌药物组合预测。该模型基于蛋白质在相互作用网络中的生物相互作用,通过治疗评分(药物组合与癌细胞系之间的相似性)和毒性评分(两种药物的相似性)来评估药物组合的协同效应。
研究背景与挑战
AI 在药物发现和再利用中面临挑战,如黑盒问题、忽略复杂的生物相互作用、药物组合可能产生不利影响等。现有网络科学方法仅关注蛋白质的拓扑距离,忽略局部连接和网络整体结构,且未优化蛋白质的权重。
GraphSynergy 框架
GraphSynergy 采用端到端机器学习框架,包含以下关键步骤:
- 基于空间的 GCN 方法:通过 Target field 和辐射场迭代聚合蛋白质信息,形成实体的潜在表示。
- 治疗评分和毒性评分:分别计算药物与癌细胞系的相似性及药物之间的相似性。
- 协同药物组合预测:基于治疗评分和毒性评分的差异,通过 sigmoid 函数评估协同概率,并使用二进制交叉熵损失函数进行训练。
数据集与基线模型
研究使用的数据集包括:
- 18,022 个基因映射到 PPI 网络中的编码蛋白(1,035 个癌细胞系和 74,9551 个关联)。
- PPI 网络(217,160 相互作用连接,15,790 个独特蛋白质)。
- 药物-蛋白质关联(4,428 种药物和 2,256 种人类蛋白质)。
- 药物-药物-细胞系关联数据集。
基线模型包括 Network Proximity (NP)、GCN、KGNN、GraRep、DeepSynergy、DeepWalk、Node2Vec 等。
实验结果
GraphSynergy 在性能上优于基线模型,具体表现为:
- 在 DrugCombDB 数据集上,GraphSynergy 的 AUC-ROC 和 AUC-PRF1 均显著高于其他模型。
- 模型变体(GraphSynergy-wip、GraphSynergy-mp、GraphSynergy-tm)进一步提升了预测性能。
- PPI 网络引入的分子机制能有效描述药物与细胞系之间的关系,无需额外基因组和化学特征。
可解释性分析
GraphSynergy 鉴定的关键蛋白质与生物医学文献一致,例如:
- 前列腺癌中,阿比特龙 + 多西他赛 和 阿比特龙 + 卡博替尼 的协同作用。
- NSCLC 细胞系中,关键蛋白质(如 TP53、SMARCC2)与药物靶点间接关联,验证了模型的预测能力。
研究结论
GraphSynergy 基于 GCN 框架增强了网络医学的预测能力,验证了蛋白质模块在 PPI 网络中的拓扑位置与药物效果的相关性。通过同时考虑治疗评分和毒性评分,GraphSynergy 超越了现有方法,为抗癌药物组合发现提供了有效工具。