DLFea4AMPGen de novo design of antimicrobial peptides by integrating features learned from deep learning models

融合深度学习模型特征的DLFea4AMPGen方法从头设计抗菌肽

来源:Nature Communications 2025, Volume 16, Article number 9134

《自然·通讯》,2025年,第16卷,文章编号9134

 

摘要

本研究提出DLFea4AMPGen策略,利用深度学习提取抗菌、抗真菌、抗氧化相关关键氨基酸特征,结合SHAP方法挖掘关键特征片段(KFF),构建合理序列空间并从头设计多功能抗菌肽。实验验证16条设计肽,12条具有双重以上活性,D1肽表现广谱抗菌,对多重耐药菌有效且体内降低细菌载量与炎症因子。该方法显著提升抗菌肽设计成功率,为应对耐药菌提供新工具。

 

关键词

抗菌肽;深度学习;从头设计;SHAP;关键特征片段;多重耐药菌;广谱抗菌;抗炎

 

研究目的

建立融合深度学习可解释特征的抗菌肽高效设计方法,获得兼具抗菌、抗真菌、抗氧化的多功能肽,为耐药菌感染提供新型候选分子。

 

研究思路

基于MP-BERT预训练模型构建抗菌、抗真菌、抗氧化预测模型;用SHAP量化氨基酸贡献,提取13aa关键特征片段;聚类分成4个亚家族构建序列空间;筛选16条肽进行体外活性、安全性、耐药性、电镜及小鼠体内实验验证。

 

研究亮点

1 首次将深度学习特征+SHAP解释用于抗菌肽从头设计,成功率达75%。

2 同时整合抗菌、抗真菌、抗氧化三重活性特征,设计多功能肽。

3 获得D1广谱高效肽,对临床多重耐药菌有效且不易诱导耐药。

4 体内验证D1可降低脏器载菌量并减轻炎症反应。

 

可延伸的方向

1 构建MIC定量预测模型进一步提升设计精度。

2 拓展至抗革兰氏阴性菌、抗结核、抗病毒肽设计。

3 优化D1序列提高活性、降低浓度、提升成药性。

4 开展制剂研究与药代动力学评价。

5 结合其他生成模型扩展序列空间与多样性。

 

测量的数据及研究意义

1 模型评估指标数据(图2a、2b),包括准确度、精确率、召回率、F1、AUC,证明预测模型性能优异。

 

2 关键特征片段统计数据(图3),确定13aa为最优长度,提取3400条KFF并分成4个亚家族。

 

3 16条候选肽抑菌率数据(图5a),75%肽具有双重以上活性,D1、D2表现最优。

 

4 MIC与生长曲线数据(图5c、5d),确定D1对耐药菌低MIC且强抑制。

5 溶血与细胞毒性数据(图5b),15条肽安全性良好,支持临床转化潜力。

6 电镜形态数据(图5e、5f),证明D1破坏细菌细胞膜完整性。

7 小鼠体内载菌量数据(图6b-6e、6j-6m),D1显著降低肝脾肾肺细菌载量。

 

8 炎症因子数据(图6f-6h、6n-6p),D1降低TNF-α、IL-1β、IL-6水平,减轻全身炎症。

 

结论

1 DLFea4AMPGen可高效精准设计多功能抗菌肽,实验成功率达75%。

2 关键特征片段(KFF)与序列空间策略显著降低计算成本并提升活性比例。

3 设计肽D1广谱抗菌,对多重耐药菌高效,不易诱导耐药,安全性高。

4 D1在小鼠败血症模型中降低细菌载量并抑制炎症,具备体内治疗潜力。

5 该方法为抗菌肽开发提供可解释、高效率、多功能的全新范式。

 

使用芬兰Bioscreen仪器测量数据的研究意义

使用Bioscreen C全自动微生物生长分析系统连续16小时、每10分钟监测OD600,获得高精度生长曲线与MIC结果;客观定量不同抗菌肽对标准菌、耐药菌的抑制强度,准确计算MIC与抑菌率,保证药敏实验标准化、可重复,为16条候选肽的体外活性排序与优选D1肽提供核心定量依据。