Cell-free Determination of Binary Complexes That Comprise Extended Protein-Protein Interaction Networks of Yersinia pestis
无细胞体系解析鼠疫耶尔森菌扩展蛋白质-蛋白质相互作用网络的二元复合物
来源:MCP Papers in Press, August 3, 2016, DOI 10.1074/mcp.M116.059337
1.论文摘要核心内容
二元蛋白质相互作用是调控细菌所有细胞功能的分子网络与动态组装体的基本构成单元,也是新型抗生素研发的潜在靶点,但针对大多数致病菌的大蛋白质组,目前仍缺乏高置信度的相关数据集。本研究利用鼠疫耶尔森菌的重组蛋白文库,对覆盖该菌85%蛋白质组(3552个蛋白)的固定化蛋白平面微阵列进行探针杂交,通过实验确定了超77000个二元相互作用。利用微阵列蛋白的表面等离子体共振成像技术,对1600余个二元复合物完成了中等(μM级别)至高亲和力(nM级别)的结合特征表征,同时识别出与其他革兰氏阴性菌共有的核心二元相互作用。对相互作用网络中的蛋白进行功能聚类后发现,参与复制、生物合成、毒力、代谢等多种生物学过程的复合物与通路出现统计学显著富集,其中还包含大量此前功能未知的蛋白;此外,与转录和翻译相关的大量蛋白集中分布在网络的高度互联子区域。本研究采用的双层微阵列策略是一种检测二元蛋白互作的创新方法,所获得的数据集也将成为分析这一重要人类致病菌蛋白互作网络的关键资源。
2.论文关键词
鼠疫耶尔森菌、蛋白质-蛋白质相互作用、二元复合物、蛋白质组微阵列、表面等离子体共振成像、相互作用动力学、随机森林算法、互作网络、毒力、抗生素靶点
3.研究目的
构建鼠疫耶尔森菌全蛋白质组规模的高置信度二元蛋白质-蛋白质相互作用(PPi)数据集,填补这一高致病性病原菌在大规模PPi研究领域的空白;
建立无细胞体系的“荧光微阵列筛选+表面等离子体共振成像(SPRi)验证”双层检测方法,实现二元蛋白互作的高通量筛选与结合动力学精准表征,克服传统酵母双杂交(Y2H)、亲和纯化-质谱联用(AP-MS)技术的固有缺陷;
解析鼠疫菌PPi网络的拓扑结构特征与功能模块,挖掘参与细菌复制、代谢、毒力、转录翻译等关键生物学过程的互作复合物与调控通路;
为鼠疫菌中功能未知的孤儿蛋白/假定蛋白推定生物学功能,完善该病原菌的蛋白功能注释体系;
从PPi网络中识别新型抗菌药物潜在靶点,为应对鼠疫菌抗生素耐药、公共卫生疫情与生物安全威胁提供理论基础与候选方向。
4.研究思路
第一步,鼠疫菌全蛋白质组微阵列构建:克隆鼠疫耶尔森菌KIM10株的开放阅读框(ORF),构建GST标签融合表达载体,通过体外无细胞表达系统与GST亲和纯化,获得3552个重组蛋白(覆盖85%全蛋白质组),制备硝酸纤维素包被的高通量蛋白质组微阵列;
第二步,高通量二元蛋白互作初筛:基于鼠疫菌与大肠杆菌的蛋白保守性,选择118个直系同源蛋白作为探针,完成生物素化与荧光标记后,与蛋白质组微阵列进行杂交,通过激光共聚焦扫描检测荧光信号,按信号标准差分级统计,累计获得77366个二元互作;
第三步,互作结合动力学精准验证:从不同信号强度的互作分组中随机挑选代表性蛋白,构建SPRi生物传感器微阵列,检测1637个互作的结合动力学,通过1:1 Langmuir结合模型拟合,获得444个互作的结合速率、解离速率与平衡解离常数(KD);
第四步,互作数据集质量评估与过滤:以大肠杆菌已验证的3485个PPi为阳性训练集、3536个非共定位蛋白对为阴性训练集,构建随机森林机器学习模型,对实验检测的互作进行验证与过滤,构建高置信度核心互作网络;
第五步,互作网络的系统生物学分析:分析核心网络的拓扑特征,通过KEGG通路富集、功能聚类识别核心生物学模块,解析孤儿蛋白在网络中的分布与作用,挖掘转录、翻译相关的高度互联子网络;
第六步,互作的生理相关性分析:通过Bioscreen仪器完成重组蛋白表达菌株的标准化培养,定量检测171个鼠疫菌蛋白的胞内丰度,结合鼠疫菌巨噬细胞感染后的时序转录组数据,分析蛋白丰度、转录水平变化对PPi的潜在影响;
第七步,结果整合与应用价值分析:总结无细胞微阵列体系的技术优势,解析PPi网络在鼠疫菌生命活动与致病过程中的意义,提出基于互作网络的新型抗菌靶点筛选策略。
5.研究亮点
首次完成了鼠疫耶尔森菌全蛋白质组规模的二元蛋白互作系统解析,构建了覆盖85%蛋白质组、包含超77000个二元互作的大规模数据集,填补了该高致病性病原菌在全基因组PPi研究领域的核心空白;
建立了“荧光蛋白质组微阵列初筛+SPRi动力学验证”的双层无细胞检测体系,克服了传统Y2H、AP-MS无法区分二元互作与多聚体/蛋白聚集体、无法提供结合动力学信息的核心缺陷,两种方法的互作重合度达32%,显著优于传统方法仅5%的结果重合率;
结合机器学习随机森林算法完成互作质量评估,构建了包含314个蛋白、2344个互作的高置信度核心互作网络,证实该网络符合无标度、高聚类系数的生物网络典型特征,对随机基因扰动具有强鲁棒性,为抗菌靶点筛选提供了拓扑学依据;
系统解析了鼠疫菌PPi网络的功能模块,发现核糖体、脂多糖(LPS)生物合成、DNA错配修复、同源重组等11个与细菌存活、增殖密切相关的KEGG通路显著富集,同时发现转录与翻译相关蛋白形成的高度互联核心子网络,揭示了细菌核心生命过程的协同调控机制;
证实鼠疫菌中仅0.3%的二元互作蛋白对由同一操纵子编码,与大肠杆菌1.6%的比例相近,颠覆了“细菌功能互作蛋白多由同一操纵子编码”的传统认知,为原核生物蛋白互作的转录调控研究提供了全新视角;
为鼠疫菌中30%的功能未知孤儿蛋白/假定蛋白推定了潜在生物学功能,发现这类蛋白广泛参与网络的核心功能簇,同时证实感染过程中被宿主抗体识别的孤儿蛋白在网络中具有更多互作,为鼠疫菌的疫苗研发、诊断靶点筛选提供了新候选;
证实鼠疫菌蛋白稳态丰度与mRNA转录水平无显著相关性,感染巨噬细胞过程中仅10%的互作相关蛋白存在时序性转录变化,明确转录水平调控对PPi的扰动作用有限,为鼠疫菌胞内感染的适应性机制研究提供了互作网络层面的依据;
挖掘了大量新型抗菌药物潜在靶点,明确网络中的枢纽蛋白(如Hfq)与关键功能互作复合物可作为抗菌干预的新方向,为应对鼠疫菌抗生素耐药与生物安全威胁提供了重要的基础资源。
6.可延伸的方向
基于本研究的PPi数据集,开展靶向网络枢纽蛋白与关键互作复合物的抗菌药物筛选,验证候选靶点的成药性、抗菌活性与体内抗感染效果;
结合动物感染模型,解析鼠疫菌在宿主巨噬细胞、跳蚤媒介体内的PPi网络动态变化,挖掘与病原菌毒力、胞内存活相关的特异性互作与调控机制;
通过基因敲除、回补、互作验证等实验,深入验证功能未知孤儿蛋白的生物学功能,明确其在鼠疫菌生长、应激响应、毒力调控中的作用;
拓展无细胞微阵列检测体系,系统筛选鼠疫菌与宿主(人、啮齿类、跳蚤)蛋白之间的跨界互作,解析病原菌感染与定植宿主的分子机制;
对比鼠疫耶尔森菌、假结核耶尔森菌、小肠结肠炎耶尔森菌的PPi网络差异,解析鼠疫菌高毒力表型进化的分子基础;
结合冷冻电镜、交联质谱等结构生物学技术,解析本研究发现的新型二元复合物的三维结构,揭示蛋白互作的分子机制与结构基础;
构建鼠疫菌PPi网络的动态扰动模型,模拟抗生素干预、宿主环境胁迫下的网络响应,为多靶点联合抗菌策略提供理论指导;
验证本研究发现的核心互作在其他革兰氏阴性致病菌中的保守性,开发广谱抗菌药物的通用靶点。
7.测量的数据、对应图表及研究意义
鼠疫菌蛋白质组微阵列构建与高通量二元互作筛选数据
测量内容:3552个鼠疫菌重组蛋白的制备与质量控制结果;118个探针蛋白与微阵列杂交的荧光信号值,按标准差分级的高、中、低强度互作数量,累计77366个二元互作
数据来源:Fig 1、补充表S1-S3
研究意义:完成了覆盖85%鼠疫菌全蛋白质组的高通量二元互作筛选,获得了首个鼠疫菌大规模二元PPi数据集,按信号强度完成了互作的初步分级,为后续动力学验证、网络构建与功能分析提供了核心基础数据。

蛋白互作结合动力学定量数据
测量内容:1637个互作的SPRi检测结果,444个符合1:1 Langmuir结合模型的互作的结合速率ka、解离速率kd、平衡解离常数KD(范围0.26~186 nM)
数据来源:Fig 2、补充图S1、补充表S4
研究意义:完成了大量二元互作的亲和力定量表征,明确了互作的结合动力学特征,验证了荧光微阵列初筛结果的可靠性,为互作的生理相关性分析提供了精准的亲和力定量数据。

操纵子结构与互作蛋白的基因组织分析数据
测量内容:鼠疫菌743个操纵子的基因组成;13633个中高强度互作中,互作蛋白对位于同一操纵子的比例(0.3%);大肠杆菌已报道互作中蛋白对位于同一操纵子的比例(1.6%)
数据来源:补充表S5、补充表S6
研究意义:证实鼠疫菌中绝大多数二元互作的编码基因并不位于同一操纵子,颠覆了“细菌功能互作蛋白多由同一操纵子编码”的传统认知,为原核生物蛋白互作的转录调控研究提供了全新的认知方向。
随机森林模型训练与互作质量验证数据
测量内容:随机森林模型的受试者工作特征(ROC)曲线,模型真阳性率88.5%、假阳性率1.6%;SPRi互作的模型验证率78.4%,荧光微阵列高、中、低强度互作的模型验证率分别为68%、51.0%、46.7%
数据来源:Fig 3、Fig 4A、Fig 4B
研究意义:建立了基于机器学习的PPi质量评估体系,验证了实验检测互作的高置信度,证实互作信号强度与验证率呈正相关,为高置信度核心互作网络的构建提供了科学的筛选标准。


高置信度PPi网络的拓扑特征数据
测量内容:核心互作网络包含314个蛋白、2344个互作;网络平均聚类系数0.232(等节点随机网络仅为0.043);网络节点度分布符合幂律分布(R²=0.93),为典型无标度网络
数据来源:Fig 4C、Fig 4D
研究意义:明确了鼠疫菌PPi网络符合生物网络的典型拓扑特征,具备高聚类系数、无标度的特性,说明网络对随机基因扰动具有强鲁棒性,而枢纽蛋白对网络完整性至关重要,为抗菌靶点筛选提供了关键的拓扑学依据。
PPi网络的功能通路富集数据
测量内容:网络中显著富集的11个KEGG通路,包括核糖体、脂肪酸生物合成、嘌呤/嘧啶代谢、LPS生物合成、丙酮酸代谢、氨酰-tRNA合成、RNA降解、RNA聚合酶、错配修复、同源重组;各通路对应的蛋白数量与互作关联
数据来源:Fig 5、补充表S6、补充表S7
研究意义:系统解析了鼠疫菌PPi网络的核心功能模块,证实核心互作集中于细菌生长、增殖、存活的关键生物学过程,明确了这些通路中蛋白的直接互作关联,为理解鼠疫菌的基础生命过程提供了互作层面的直接证据。

功能模块间的互作关联数据
测量内容:核糖体、氨酰-tRNA合成、脂肪酸生物合成、丙酮酸代谢、同源重组、RNA降解等功能模块内的蛋白互作,以及模块间的跨功能互联关系
数据来源:Fig 6
研究意义:揭示了鼠疫菌不同生物学功能模块之间的直接互作关联,验证了多个已报道的经典蛋白互作,同时发现了功能模块间的新型交联关系,为理解细菌核心生命过程的协同调控机制提供了新线索。

网络蛋白的功能分类与孤儿蛋白分析数据
测量内容:314个网络蛋白中,70%有功能注释,25%可映射到蛋白家族;30%为功能未知的孤儿/假定蛋白;孤儿蛋白的互作数量、宿主抗体识别情况
数据来源:Fig 7、补充表S8、补充表S9
研究意义:明确了鼠疫菌PPi网络中包含大量功能未知的孤儿蛋白,通过互作网络为这些蛋白推定了潜在生物学功能,同时发现感染过程中被宿主抗体识别的孤儿蛋白在网络中具有更多互作,为鼠疫菌的疫苗研发、诊断靶点开发提供了新的候选方向。

网络高互联核心簇的分析数据
测量内容:通过MCODE算法识别的两个高度互联核心簇,包含的蛋白数量、互作数量,以及转录、翻译相关蛋白的富集情况
数据来源:Fig 8
研究意义:发现了转录与翻译相关蛋白形成的高度互联子网络,揭示了鼠疫菌基因表达核心过程的大分子互作关联,同时发现大量孤儿蛋白参与这些核心功能簇,为理解细菌转录与翻译的协同调控机制提供了全新视角。

蛋白丰度与转录水平的关联分析数据
测量内容:171个鼠疫菌蛋白在大肠杆菌中表达的稳态丰度;鼠疫菌感染巨噬细胞后1.5 h、8 h的mRNA转录水平变化;蛋白丰度与mRNA水平的相关性;蛋白丰度与互作KD值的相关性
数据来源:Fig 9、补充图S2
研究意义:证实鼠疫菌中蛋白稳态丰度与mRNA转录水平无显著相关性,90%的互作相关蛋白在感染过程中转录水平无显著变化,仅10%的蛋白存在时序性转录变化,为分析体内感染过程中PPi的动态变化提供了依据,同时证实蛋白丰度与互作亲和力无显著相关性。

8.研究核心结论
本研究首次完成了鼠疫耶尔森菌全蛋白质组规模的二元蛋白互作系统分析,通过覆盖85%全蛋白质组的无细胞蛋白质微阵列,获得了包含超77000个二元互作的大规模数据集,同时通过SPRi完成了1600余个互作的结合动力学表征,填补了这一高致病性病原菌在全基因组PPi研究领域的核心空白。
建立的“荧光微阵列初筛+SPRi动力学验证”双层无细胞检测体系,可有效检测二元蛋白互作,克服了传统Y2H、AP-MS无法区分二元互作与多聚体/蛋白聚集体、无法提供结合动力学信息的核心缺陷,两种方法的互作重合度达32%,显著优于传统高通量PPi检测方法,为致病菌蛋白互作研究提供了创新的技术平台。
基于随机森林机器学习算法构建的高置信度鼠疫菌核心PPi网络,包含314个蛋白、2344个互作,该网络符合无标度、高聚类系数的生物网络典型特征,对随机基因扰动具有强鲁棒性,网络中的枢纽蛋白是抗菌干预的关键潜在靶点。
鼠疫菌PPi网络显著富集于核糖体、LPS生物合成、DNA错配修复、同源重组等11个与细菌存活、增殖密切相关的KEGG通路,同时发现了转录与翻译相关蛋白形成的高度互联核心子网络,揭示了细菌核心生命过程的直接互作关联与协同调控机制。
鼠疫菌中仅0.3%的二元互作蛋白对由同一操纵子编码,与大肠杆菌1.6%的比例相近,说明绝大多数细菌功能互作蛋白的编码基因并不受同一操纵子调控,颠覆了传统认知,为原核生物蛋白互作的转录调控研究提供了全新视角。
鼠疫菌PPi网络中30%的蛋白为功能未知的孤儿/假定蛋白,这类蛋白广泛参与网络的核心功能簇,通过互作关联可推定其潜在生物学功能,完善了鼠疫菌的蛋白功能注释体系,同时为毒力因子与新型抗菌靶点的挖掘提供了新方向。
鼠疫菌蛋白的稳态丰度与mRNA转录水平无显著相关性,感染巨噬细胞过程中仅10%的互作相关蛋白存在时序性转录变化,说明转录水平调控对PPi的扰动作用有限,为鼠疫菌胞内感染的适应性机制研究提供了互作网络层面的依据。
本研究构建的鼠疫菌PPi网络是该病原菌系统生物学研究的核心资源,其中的网络枢纽蛋白(如Hfq)与关键功能互作复合物,是应对鼠疫菌抗生素耐药与生物安全威胁的新型抗菌药物潜在靶点。
9.芬兰Bioscreen仪器测量的微生物生长曲线数据的研究意义
本研究中使用芬兰Bioscreen C MBR全自动微生物生长曲线分析系统,对转化了鼠疫菌GST标签重组蛋白表达质粒的大肠杆菌BL21-AI菌株进行培养,通过实时OD600监测把控菌株生长状态,完成了171个鼠疫菌重组蛋白的诱导表达与后续丰度定量,该部分数据的核心研究意义如下:
精准控制细菌生长阶段,保障重组蛋白表达的一致性与可重复性
研究通过Bioscreen C MBR仪器的自动化恒温培养、持续震荡与实时OD600监测功能,可精准把控171个不同重组蛋白表达菌株的生长状态,确保所有菌株均在对数生长期中期进行阿拉伯糖诱导表达。该仪器的高通量平行培养能力,实现了上百个菌株的同步培养,消除了手动摇瓶培养过程中温度、震荡频率、生长阶段判断的人为误差,保障了所有菌株在蛋白诱导前的生长状态完全一致,确保后续蛋白丰度定量检测的平行性、可重复性与准确性,为“蛋白丰度与mRNA水平无相关性”的核心结论提供了严谨的样本基础。
动态监测菌株生长状态,排除生长差异对蛋白丰度检测的干扰
不同鼠疫菌重组蛋白在大肠杆菌中的异源表达,可能会对宿主菌的生长产生不同程度的抑制或促进作用,而细菌的生长状态会直接影响蛋白的翻译效率与表达丰度。Bioscreen仪器可实时记录每一株菌的完整生长曲线,精准监测菌株的生长速率、倍增时间与对数生长期节点,能够有效识别异源蛋白表达对细菌生长的影响,排除因菌株生长差异导致的蛋白丰度检测偏差。通过该仪器的动态监测,研究确保了所有样本均在相同的生长阶段、相同的诱导时长下收获,保证了蛋白丰度定量结果能够真实反映蛋白本身的翻译效率,而非细菌生长状态的差异,让后续蛋白丰度与互作亲和力的相关性分析结论更加可靠。
高通量平行培养能力,支撑大规模蛋白丰度定量实验的顺利完成
本研究需要对171个鼠疫菌ORF编码的重组蛋白进行平行的表达、纯化与丰度定量,传统的手动培养、单点OD检测方法,难以实现上百个菌株的同步培养与生长状态精准把控。Bioscreen仪器的多孔板培养体系,可同时完成数十至上百个菌株的平行培养与实时生长监测,大幅提升了实验通量与操作效率,确保了大规模蛋白丰度定量实验的顺利完成。同时,仪器的封闭培养体系显著降低了样本污染的风险,保障了171个菌株培养的成功率,为后续的蛋白定量实验提供了充足、合格的菌体样本。
标准化培养体系,保障实验结果的可靠性与组间可比性
Bioscreen仪器提供了完全标准化的培养环境,可精准控制37℃恒温、持续恒定的震荡速率,消除了环境因素波动对细菌生长的影响,使得不同批次、不同孔板的菌株培养条件完全一致。这种标准化的培养体系,保障了171个鼠疫菌蛋白的表达实验在完全相同的培养条件下完成,使得不同蛋白之间的丰度检测结果具有直接的可比性,排除了环境因素对实验结果的干扰,让“蛋白丰度与互作KD值无相关性”的分析结论更加严谨、可信。
