融合深度学习模型特征的DLFea4AMPGen方法从头设计抗菌肽-上海谓载科技有限公司

文献分类

融合深度学习模型特征的DLFea4AMPGen方法从头设计抗菌肽

DLFea4AMPGen de novo design of antimicrobial peptides by integrating features learned from deep learning models

融合深度学习模型特征的DLFea4AMPGen方法从头设计抗菌肽

来源：Nature Communications 2025, Volume 16, Article number 9134

《自然·通讯》，2025年，第16卷，文章编号9134

摘要

本研究提出DLFea4AMPGen策略，利用深度学习提取抗菌、抗真菌、抗氧化相关关键氨基酸特征，结合SHAP方法挖掘关键特征片段（KFF），构建合理序列空间并从头设计多功能抗菌肽。实验验证16条设计肽，12条具有双重以上活性，D1肽表现广谱抗菌，对多重耐药菌有效且体内降低细菌载量与炎症因子。该方法显著提升抗菌肽设计成功率，为应对耐药菌提供新工具。

关键词

抗菌肽；深度学习；从头设计；SHAP；关键特征片段；多重耐药菌；广谱抗菌；抗炎

研究目的

建立融合深度学习可解释特征的抗菌肽高效设计方法，获得兼具抗菌、抗真菌、抗氧化的多功能肽，为耐药菌感染提供新型候选分子。

研究思路

基于MP-BERT预训练模型构建抗菌、抗真菌、抗氧化预测模型；用SHAP量化氨基酸贡献，提取13aa关键特征片段；聚类分成4个亚家族构建序列空间；筛选16条肽进行体外活性、安全性、耐药性、电镜及小鼠体内实验验证。

研究亮点

1 首次将深度学习特征+SHAP解释用于抗菌肽从头设计，成功率达75%。

2 同时整合抗菌、抗真菌、抗氧化三重活性特征，设计多功能肽。

3 获得D1广谱高效肽，对临床多重耐药菌有效且不易诱导耐药。

4 体内验证D1可降低脏器载菌量并减轻炎症反应。

可延伸的方向

1 构建MIC定量预测模型进一步提升设计精度。

2 拓展至抗革兰氏阴性菌、抗结核、抗病毒肽设计。

3 优化D1序列提高活性、降低浓度、提升成药性。

4 开展制剂研究与药代动力学评价。

5 结合其他生成模型扩展序列空间与多样性。

测量的数据及研究意义

1 模型评估指标数据（图2a、2b），包括准确度、精确率、召回率、F1、AUC，证明预测模型性能优异。

2 关键特征片段统计数据（图3），确定13aa为最优长度，提取3400条KFF并分成4个亚家族。

3 16条候选肽抑菌率数据（图5a），75%肽具有双重以上活性，D1、D2表现最优。

4 MIC与生长曲线数据（图5c、5d），确定D1对耐药菌低MIC且强抑制。

5 溶血与细胞毒性数据（图5b），15条肽安全性良好，支持临床转化潜力。

6 电镜形态数据（图5e、5f），证明D1破坏细菌细胞膜完整性。

7 小鼠体内载菌量数据（图6b-6e、6j-6m），D1显著降低肝脾肾肺细菌载量。

8 炎症因子数据（图6f-6h、6n-6p），D1降低TNF-α、IL-1β、IL-6水平，减轻全身炎症。

结论

1 DLFea4AMPGen可高效精准设计多功能抗菌肽，实验成功率达75%。

2 关键特征片段（KFF）与序列空间策略显著降低计算成本并提升活性比例。

3 设计肽D1广谱抗菌，对多重耐药菌高效，不易诱导耐药，安全性高。

4 D1在小鼠败血症模型中降低细菌载量并抑制炎症，具备体内治疗潜力。

5 该方法为抗菌肽开发提供可解释、高效率、多功能的全新范式。

使用芬兰Bioscreen仪器测量数据的研究意义

使用Bioscreen C全自动微生物生长分析系统连续16小时、每10分钟监测OD600，获得高精度生长曲线与MIC结果；客观定量不同抗菌肽对标准菌、耐药菌的抑制强度，准确计算MIC与抑菌率，保证药敏实验标准化、可重复，为16条候选肽的体外活性排序与优选D1肽提供核心定量依据。