DLFea4AMPGen de novo design of antimicrobial peptides by integrating features learned from deep learning models
DLFea4AMPGen:融合深度学习模型特征的抗菌肽从头设计
来源:Nature Communications, 2025, 16:9134, DOI 10.1038/s41467-025-64378-y
《自然·通讯》,2025年,第16卷,文章编号9134,DOI 10.1038/s41467-025-64378-y
摘要
深度学习在抗菌肽设计中潜力巨大,但现有方法存在筛选成功率低、虚拟序列库规模过大等问题。本文提出DLFea4AMPGen策略,通过深度学习提取抗菌、抗真菌、抗氧化相关关键特征,利用SHAP方法量化氨基酸贡献,提取关键特征片段并分为四个亚家族,构建合理序列空间并从头设计16条候选肽。实验验证显示75%的序列具备至少两种活性,其中D1肽对多重耐药菌具有广谱抗菌活性,体内可降低细菌载量并减轻炎症。该策略为高效、精准设计多功能抗菌肽提供了新范式。
关键词
抗菌肽;深度学习;从头设计;SHAP;多重耐药菌;广谱抗菌;抗氧化
研究目的
解决现有深度学习抗菌肽设计方法成功率低、序列库过大、计算成本高、功能单一等问题,构建一种融合深度学习特征、可解释、高成功率的多功能抗菌肽从头设计策略,获得对多重耐药菌有效且安全的新型抗菌肽。
研究思路
1. 基于迁移学习微调MP‑BERT模型,构建抗菌、抗真菌、抗氧化三个预测模型。
2. 用SHAP方法解析模型,提取13氨基酸关键特征片段,按序列特征分为四个亚家族。
3. 以高频氨基酸构建合理序列空间,经模型打分、电荷筛选、聚类后获得16条代表性候选肽。
4. 开展体外活性、安全性、耐药性、膜损伤检测,优选D1进行小鼠败血症模型体内验证。
5. 整合数据证明DLFea4AMPGen的高效性与实用性。
研究亮点
1. 首次将SHAP可解释性与深度学习结合,精准提取抗菌肽功能关键特征,大幅提升设计成功率。
2. 同时整合抗菌、抗真菌、抗氧化三种功能,设计多功能一体化抗菌肽。
3. 构建合理序列空间,显著降低计算量并保持序列多样性,解决超大库筛选难题。
4. 获得对临床多重耐药菌高效、低溶血、低毒性的D1肽,体内治疗效果明确。
5. 整套流程开源可重复,为AI辅助肽类药物开发提供标准化方案。
可延伸的方向
1. 引入MIC定量预测模型,实现抗菌活性精准预测。
2. 拓展抗病毒、抗寄生虫、抗炎等功能,开发多效肽。
3. 结合分子动力学模拟优化肽结构,提升稳定性与药效。
4. 开展制剂研究,实现靶向递送与体内长效作用。
5. 扩大菌种范围,验证对革兰氏阴性耐药菌、真菌、结核分枝杆菌等的活性。
测量的数据及研究意义
1. 模型性能数据(图2a、2b):准确率、精确率、召回率、F1、AUC值,证明ABP‑MPB、AFP‑MPB、AOP‑MPB优于传统模型与现有SOTA方法,为后续特征提取提供可靠基础。

2. 三重活性肽数量数据(图2c、2d):20个数据集中4760条肽同时具备三种活性,明确多功能肽的序列特征来源。
3. 关键特征片段分析数据(图3):3400条KFF、氨基酸频率、系统发育树分四亚家族,揭示决定活性的核心氨基酸与序列模式。

4. 序列空间筛选数据(图4a):四亚家族序列经筛选后规模大幅缩减,证明策略高效低耗。

5. 体外活性数据(图5a):16条肽抑菌率、抗真菌率、ABTS+清除率,证实75%具备多重活性,D1、D2最优。

6. 安全性数据(图5b):溶血率与细胞毒性,证明15条肽安全性良好,适合后续开发。
7. 耐药菌MIC与生长曲线(图5c、5d):D1、D2对畜禽与临床耐药菌强效,D1连续传代100代不诱导耐药。
8. 膜损伤电镜数据(图5e、5f):SEM与TEM显示D1破坏细菌细胞膜完整性,揭示作用机制。
9. 小鼠体内疗效数据(图6):脏器细菌载量、TNF‑α、IL‑1β、IL‑6水平,证明D1可清除细菌并减轻炎症。

结论
1. DLFea4AMPGen是高效的抗菌肽从头设计策略,特征驱动的序列空间可显著提升活性成功率至75%。
2. 基于SHAP提取的关键特征片段能准确反映抗菌、抗真菌、抗氧化的核心序列规律。
3. 从头设计的D1肽具有广谱、强效、低毒、不诱导耐药的特点,通过破坏细胞膜发挥作用。
4. D1在小鼠多重耐药菌败血症模型中有效降低细菌载量并抑制炎症,具备临床转化潜力。
5. 该方法为AI驱动的多功能肽药物设计提供了可扩展、可解释的新框架。
使用芬兰Bioscreen仪器测量数据的研究意义
使用芬兰Bioscreen C微生物生长自动分析仪,在37℃条件下连续16小时、每10分钟测定OD600,获得高精度微生物生长曲线。该数据客观、动态地反映候选肽对细菌增殖全过程的抑制效果,可精准判断抑菌强度、起效时间与持续作用,避免终点法读数偏差。同时为MIC判定提供可靠依据,直观展示D1、D2对多重耐药菌的快速、强效抑制作用,为体外活性评价提供标准化、可重复的关键证据,支撑后续体内实验与机制研究。
