DLFea4AMPGen de novo design of antimicrobial peptides by integrating features learned from deep learning models
融合深度学习模型特征的DLFea4AMPGen方法从头设计抗菌肽
来源:Nature Communications 2025, Volume 16, Article number 9134
《自然·通讯》,2025年,第16卷,文章编号9134
摘要
本研究提出DLFea4AMPGen策略,利用深度学习提取抗菌、抗真菌、抗氧化相关关键氨基酸特征,结合SHAP方法挖掘关键特征片段(KFF),构建合理序列空间并从头设计多功能抗菌肽。实验验证16条设计肽,12条具有双重以上活性,D1肽表现广谱抗菌,对多重耐药菌有效且体内降低细菌载量与炎症因子。该方法显著提升抗菌肽设计成功率,为应对耐药菌提供新工具。
关键词
抗菌肽;深度学习;从头设计;SHAP;关键特征片段;多重耐药菌;广谱抗菌;抗炎
研究目的
建立融合深度学习可解释特征的抗菌肽高效设计方法,获得兼具抗菌、抗真菌、抗氧化的多功能肽,为耐药菌感染提供新型候选分子。
研究思路
基于MP-BERT预训练模型构建抗菌、抗真菌、抗氧化预测模型;用SHAP量化氨基酸贡献,提取13aa关键特征片段;聚类分成4个亚家族构建序列空间;筛选16条肽进行体外活性、安全性、耐药性、电镜及小鼠体内实验验证。
研究亮点
1 首次将深度学习特征+SHAP解释用于抗菌肽从头设计,成功率达75%。
2 同时整合抗菌、抗真菌、抗氧化三重活性特征,设计多功能肽。
3 获得D1广谱高效肽,对临床多重耐药菌有效且不易诱导耐药。
4 体内验证D1可降低脏器载菌量并减轻炎症反应。
可延伸的方向
1 构建MIC定量预测模型进一步提升设计精度。
2 拓展至抗革兰氏阴性菌、抗结核、抗病毒肽设计。
3 优化D1序列提高活性、降低浓度、提升成药性。
4 开展制剂研究与药代动力学评价。
5 结合其他生成模型扩展序列空间与多样性。
测量的数据及研究意义
1 模型评估指标数据(图2a、2b),包括准确度、精确率、召回率、F1、AUC,证明预测模型性能优异。

2 关键特征片段统计数据(图3),确定13aa为最优长度,提取3400条KFF并分成4个亚家族。

3 16条候选肽抑菌率数据(图5a),75%肽具有双重以上活性,D1、D2表现最优。

4 MIC与生长曲线数据(图5c、5d),确定D1对耐药菌低MIC且强抑制。
5 溶血与细胞毒性数据(图5b),15条肽安全性良好,支持临床转化潜力。
6 电镜形态数据(图5e、5f),证明D1破坏细菌细胞膜完整性。
7 小鼠体内载菌量数据(图6b-6e、6j-6m),D1显著降低肝脾肾肺细菌载量。

8 炎症因子数据(图6f-6h、6n-6p),D1降低TNF-α、IL-1β、IL-6水平,减轻全身炎症。
结论
1 DLFea4AMPGen可高效精准设计多功能抗菌肽,实验成功率达75%。
2 关键特征片段(KFF)与序列空间策略显著降低计算成本并提升活性比例。
3 设计肽D1广谱抗菌,对多重耐药菌高效,不易诱导耐药,安全性高。
4 D1在小鼠败血症模型中降低细菌载量并抑制炎症,具备体内治疗潜力。
5 该方法为抗菌肽开发提供可解释、高效率、多功能的全新范式。
使用芬兰Bioscreen仪器测量数据的研究意义
使用Bioscreen C全自动微生物生长分析系统连续16小时、每10分钟监测OD600,获得高精度生长曲线与MIC结果;客观定量不同抗菌肽对标准菌、耐药菌的抑制强度,准确计算MIC与抑菌率,保证药敏实验标准化、可重复,为16条候选肽的体外活性排序与优选D1肽提供核心定量依据。
